لماذا يعاني الكثير من متتبعات الوجوه والصور الرمزية من مشكلة خفض الحاجب الإيجابي الكاذب؟ باستخدام ARKit من Apple كدراسة حالة، يستكشف هذا التحليل جذور المشكلة ويكشف عن حل بسيط ومدهش في النهاية.
الصور الرمزية والابتسامات: إصدار ميموجي
يُعد خفض الحاجب الإيجابي الكاذب مشكلة واسعة الانتشار في تتبع الوجه والرسوم المتحركة للأفاتار. على الرغم من أن هذه الأخطاء خفية، إلا أنها قد تشوه تعبيرات الصورة الرمزية وتقدم إشارات غير مقصودة للحزن أو الغضب أو القلق. في الفيديو أدناه، أقوم باختبار ميموجي من Apple لتوضيح هذه المشكلة أثناء العمل.
في المقطع أعلاه، لاحظ كيف "يعكس" ميموجي "ابتسامتي". هل لاحظت أي شيء غريب أو غير سار؟ زوايا حاجبي الداخلية منخفضة بشكل خاطئ. تستمر إضافة خفض الحاجبين بشكل خاطئ في أنواع مختلفة من الابتسامات. ويستمر في المستخدمين الآخرين أيضًا.
الحواجب الداخلية المنخفضة إلى جانب الشفة العلوية المرتفعة (الناتجة عن تجاعيد الأنف أو رافع الشفة العلوية) غالبًا ما يرتبط بالمشاعر غير السارة. كما ترتبط أطراف الجبين المنخفضة أيضًا بشكل سلبي مع الابتسام. يمكن لهذه الأنواع من أخطاء التتبع الدلالية الهامة من الناحية الدلالية أن توحي عن غير قصد بمشاعر سلبية.
كيف تحدث هذه الأخطاء
غالبًا ما ينبع خفض الحاجب الإيجابي الكاذب من مشاكل في جودة البيانات، وأخطاء في التسمية، والخيارات الفنية. وإليك سبب استمرار هذه المشاكل:
- لا يوجد تركيز كافٍ على جودة البيانات.
- لا يوجد تركيز كافٍ على الفن.
في كل مكان عملت فيه، كان هناك الكثير من القلق بشأن توظيف مهندسين ذوي خلفية معينة لدرجة أن عدد الموظفين من الأدوار الأساسية الأخرى.
يفترض العديد من قادة التكنولوجيا أنهم إذا حصلوا على بيانات كافية لتدريب نموذجهم، فإن المشاكل المتعلقة بالجودة ستحل نفسها بنفسها ببساطة. واو! السحر. هذا الافتراض غالبًا ما يعمل في ظل اعتقاد إضافي (ولكن خاطئ) بأنه لا يوجد سوى نسبة ضئيلة من البيانات غير النقية.
لقد تعمّقت في خنادق البيانات وعملت تقريباً في جميع الأدوار غير الهندسية في تتبع الوجوه:
- تخطيط البيانات - تحديد نوع بيانات التعبير التي يجب جمعها وكيفية جمعها
- جمع البيانات - العمل فعلياً مع المشاركين وتدريبهم على ضرب أوضاع التعبير الصحيحة
- شرح توضيحي للبيانات - تحديد أفضل الطرق لتسمية المعالم
- تصنيف البيانات - تقديم المشورة الهندسية حول الفئات التي يجب أن تكون موجودة، وما هي معاييرها، وكيفية التعامل مع حالاتها الحتمية
- توسيع النطاق - التأكد من أن قواعد التعليق التوضيحي والتصنيف موحدة وسهلة الفهم من قبل واضعي العلامات على نطاق واسع
- مراقبة التتبع - مقارنة الحقيقة الأرضية بنتائج التتبع
- تحديد مجالات التحسين - معرفة المشاكل الموجودة وكيف يمكن تحسينها من خلال التخطيط و/أو التجميع و/أو الشرح و/أو التصنيف
- تطوير الصورة الرمزية - وضع استراتيجية لتحديد الأشكال التي يجب تحديد أولوياتها بناءً على مزيج من الاعتبارات مثل -
- حيث يفشل المتتبع
- ما هي حالات استخدام المنتج النهائي
- ما الذي سيكون أكثر إرضاءً من الناحية الجمالية
- ما هو الأكثر أهمية من الناحية الدلالية
من خلال خلفيتي في علم التعبير، وتشريح الوجه، والعمل المكثف مع بيانات الوجه، يمكنني القول بثقة أن البيانات غير النقية هي مشكلة رئيسية في تتبع الوجه، وليست مشكلة ثانوية. باختصار، حتى لو كانت الخوارزمية مثالية، فإن المشاكل تنشأ من:
البيانات المفترضة غير نقية
- عند جمع بيانات التعبير المشكل من المشاركين من البشر، ستكون البيانات ملوثة دائمًا. مضمونة.
- لا يستطيع معظم الناس الوصول إلى كل تعبير مستهدف. من النادر العثور على بيانات حركة وجهية خالصة. عندما يؤدي المشاركون تعبيرات غير نقية، فذلك إما لأنهم يعرضون حركة الوجه الخاطئة أو لأنهم غير قادرين على عزل التعبير المستهدف دون استخدام عضلات وجه إضافية غير مستهدفة.
- وفوق كل ذلك، لا يستطيع أخصائيو الاستحواذ على البيانات في كثير من الأحيان معرفة ما إذا كان المشارك يحقق حتى التعبير المستهدف. ولا يعود هذا النقص في المعرفة إلى خطأ أخصائيي الحصول على البيانات، بل إلى أولويات الشركة "س" التي لم تكن في محلها وعدم الاهتمام بتوظيف المواهب المناسبة أو الاحتفاظ بها.
توسيم البيانات السيئة
- نظرًا للتركيز المفرط على المواهب الهندسية، عادةً ما تهمل الشركات إعطاء الأولوية لوظائف تصنيف البيانات. وبدلاً من ذلك، غالبًا ما يتم التعامل مع جهود التسمية التوضيحية على أنها وظائف منخفضة المستوى مخصصة للمتعاقدين الذين لا يتمتعون بخبرة معينة.
- يمكن للمقاولين الذين يبدأون العمل بخبرة قليلة أن يصبحوا في نهاية المطاف على دراية كافية بالبيانات لاكتساب الخبرة؛ ومع ذلك، نادراً ما يحدث هذا، لأن وظائف وضع العلامات التعاقدية عادةً ما يكون معدل دوران الموظفين فيها مرتفعاً.
اختيارات فنية غير مدروسة
- من المهم للفن أن يفهم التقنية، وللتقنية أن تفهم الفن. هناك انفصال مذهل بين الفن والهندسة داخل شركات التكنولوجيا. في كثير من الحالات، تبدو أدوات التتبع الجيدة جيدة ليس بسبب أدوات التتبع نفسها، ولكن بسبب الخيارات الفنية التي تم اتخاذها لمكافحة التكنولوجيا غير الناضجة وراء الكواليس. يجب استثمار المزيد من الموارد لسد الفجوة بين الفن والهندسة.
الرجوع إلى ميموجي وخفض الحاجب الإيجابي الكاذب
كما ذكرت في بداية هذا المنشور، كلما حاولت ميموجي أن تعكس ابتسامتي، هناك إضافة غير ضرورية لخفض الحاجب عند الزوايا الداخلية لحاجبي. مرة أخرى، تستمر هذه الإضافة في أنواع مختلفة من الابتسامات.
الرسم البياني أدناه هو مثال على كيف يمكن أن يؤثر التفاعل بين جودة البيانات والفن على التعبيرات المختلفة بطرق سلبية ويسبب مشاكل مثل خفض الحاجبين مع الابتسامات.
ملاحظة: بالطبع يمكن أن تكون هناك أسباب محتملة متعددة، بما في ذلك مشاكل في الخوارزمية نفسها؛ ومع ذلك، تم وضع هذا المخطط لتسليط الضوء على سيناريو محدد مع مجموعة محددة من الشروط.
تفكيكها
مجعد الأنف ورافع الشفة العليا وجهان متشابهان في الشكل
- غالبًا ما يتم الخلط بينهما على مستوى جمع البيانات ومستوى تصنيف البيانات.
- نظرًا لأن شركات التكنولوجيا لا تستثمر بشكل صحيح في جودة البيانات، فإنها عادةً لا تقوم بتعزيز الموظفين الذين يمكنهم تحديد أو شرح كيفية التمييز بدقة تجاعيد الأنف و رافع الشفة العلوية.
- تمر الأخطاء في كل من جمع البيانات ووضع العلامات على البيانات دون أن يلاحظها أحد، ولا تستطيع الموهبة اكتشاف أخطاء التتبع.
من الأساليب الشائعة في الفن استخدام رافع الشفة العلوية كإضافة شكل مزيج من الأشكال الإضافية للابتسامات.
- نظرًا لأن حركة ساحبة زاوية الشفاه ترفع الشفة العلوية عند الابتسامة الشديدة، يفترض الكثيرون أن هذه الحركة مرادفة لـ رافع الشفة العليا الأمر ليس بهذه البساطة.
- يستخدم العديد من الفنانين رافع الشفة العلوية الشكل للاندماج مع ساحبة زاوية الشفاه لخلق ابتسامة قوية المزيد من التفاصيل هنا.
- وبغض النظر عن المسائل الجمالية والدقة، تظل هناك مشكلة صارخة: إذا كان رافع الشفة العلوية مرتبط بـ تجاعيد الأنف عند بدء ابتسامة قوية، سيتم تنشيط رافع الشفة العليا والتي ستقوم بعد ذلك بتنشيط تجاعيد الأنف. لذلك، عندما يبتسم شخص ما، فإن حاجبيه ينخفضان. سيئ.
لا يتم إيلاء الاهتمام الكافي لجودة البيانات.
لا يُعطى التقدير الكافي للفن.
إصلاح المشكلة
أبسط حل؟ ابتعد عن تشريح الوجه واعتمد على تشريح الوجه. الحل الأسهل لتقليل التخفيض الإيجابي الكاذب عبر تجاعيد الأنف و رافع الشفة العلوية هو تكريم خصائص العضلات التي تقف وراء هذه الأفعال.
من وجهة نظر تشريحية، لا توجد رافعة رافعه للحنك العلوي (رافع الشفة العلوية ) ولا العضلة الرافعة الرافعة، ولا العضلة الرافعة الرافعة، ولا العضلة الرافعة الرافعة، ولا العضلة الرافعة العلوية (تجاعيد الأنف العضلية) يخفض الحاجبين. وفي حدود قواعد ترميز الوجه FACS، فإن خفض الحاجبين مرتبط فقط بتجاعيد الأنف.
يمكنك أن توفر على نفسك الصداع إذا قمت ببساطة:
- قم بإعادة تصميم قواعد التسمية الخاصة بك لتصنيف خفض الحاجب كإجراء منفصل عن تجاعيد الأنف
- إعادة تصميم مزيج من الأشكال لاستضافة تجاعيد الأنف دون خفض الحاجب المتأصل