एआरकिट और अन्य फेस ट्रैकिंग की गलतियाँ

इतने सारे फेस ट्रैकर और अवतार झूठी सकारात्मक भौंह नीचे होने की समस्या से क्यों ग्रस्त हैं? Apple के ARKit को केस स्टडी के रूप में लेते हुए, यह विश्लेषण समस्या की जड़ तक जाता है और अंत में एक आश्चर्यजनक रूप से सरल समाधान प्रस्तुत करता है।. 

अवतार और मुस्कान: मेमोजी संस्करण

गलत-सकारात्मक भौंहें नीचे आना चेहरा ट्रैकिंग और अवतार एनीमेशन में एक व्यापक समस्या है। यद्यपि ये सूक्ष्म हैं, ये त्रुटियाँ अवतार के भावों को विकृत कर सकती हैं, जिससे दुःख, क्रोध या चिंता के अनपेक्षित संकेत उत्पन्न होते हैं। नीचे दिए गए वीडियो में, मैं इस समस्या को क्रियाशील रूप में दिखाने के लिए Apple के Memoji का तनाव परीक्षण करता हूँ।.

 

ऊपर दिए गए क्लिप में देखें कि मेरी मेमोजी मेरी मुस्कान को कैसे “प्रतिबिंबित” करती है। क्या कुछ अजीब या अप्रिय दिख रहा है? मेरी भौंहों के भीतरी कोने गलती से नीचे झुके हुए हैं। भौंहों के गलत तरीके से नीचे झुकने की यह त्रुटि विभिन्न प्रकार की मुस्कानों में भी बनी रहती है। यह अन्य उपयोगकर्ताओं में भी दिखाई देती है।.

निचली आंतरिक भौंहें झुकी हुई और ऊपरी होंठ उठा हुआ (के कारण नाक झुर्रियुक्त या ऊपरी होंठ उठाने वाला) अक्सर अप्रिय भावनाओं से जुड़ा होता है। भौंहों के निचले सिरे भी मुस्कुराहट से नकारात्मक रूप से संबंधित होते हैं। इस प्रकार के अर्थपूर्ण ट्रैकिंग त्रुटियाँ अनजाने में नकारात्मक भावना व्यक्त कर सकती हैं।.

ये गलतियाँ कैसे होती हैं

गलत सकारात्मक भौंह नीची दिखाने वाले परिणाम अक्सर डेटा गुणवत्ता की समस्याओं, लेबलिंग त्रुटियों और कलात्मक विकल्पों से उत्पन्न होते हैं। ये समस्याएँ बनी रहने का कारण यह है:

  1. डेटा गुणवत्ता पर पर्याप्त ध्यान नहीं दिया जा रहा है।.
  2. कला पर पर्याप्त ध्यान नहीं है।.

जहाँ-जहाँ मैंने काम किया है, वहाँ एक विशिष्ट पृष्ठभूमि वाले इंजीनियरों को भर्ती करने को लेकर इतनी चिंता रही है कि अन्य आवश्यक भूमिकाओं से हेडकाउंट हटाया जाता है।.

कई टेक लीड्स यह मान लेते हैं कि अगर वे अपने मॉडल को प्रशिक्षित करने के लिए पर्याप्त डेटा हासिल कर लें, तो गुणवत्ता संबंधी समस्याएँ अपने आप ही हल हो जाएँगी। वाह! जादू। यह धारणा अक्सर इस अतिरिक्त (लेकिन गलत) विश्वास के तहत काम करती है कि अशुद्ध डेटा का प्रतिशत नगण्य ही होता है।.

मैं डेटा की गहराइयों में रहा हूँ और फेस ट्रैकिंग में लगभग हर गैर-इंजीनियरिंग भूमिका में काम किया है:

  • डेटा योजना – यह निर्धारित करना कि किस प्रकार का अभिव्यक्ति डेटा एकत्र किया जाए और उसे कैसे एकत्र किया जाए
  • डेटा संग्रह – वास्तव में प्रतिभागियों के साथ काम करना और उन्हें सही भाव-भंगिमाएँ दिखाने के लिए प्रशिक्षित करना
  • डेटा एनोटेशन – लैंडमार्क को लेबल करने के सर्वोत्तम तरीकों का निर्धारण
  • डेटा वर्गीकरण – इंजीनियरिंग को यह सलाह देना कि कौन-कौन सी क्लासेज़ होनी चाहिए, उनके पैरामीटर्स क्या हैं, और उनके अपरिहार्य एज केस को कैसे हैंडल किया जाए।
  • विस्तार – यह सुनिश्चित करना कि एनोटेशन और वर्गीकरण के नियम मानकीकृत हों और बड़े पैमाने पर लेबल करने वालों के लिए समझने में आसान हों।
  • निगरानी ट्रैकिंग – ग्राउंड ट्रुथ की ट्रैकिंग परिणामों से तुलना
  • सुधार के क्षेत्रों की पहचान – यह पता लगाना कि कौन सी समस्याएँ मौजूद हैं और योजना, संग्रह, एनोटेशन और/या वर्गीकरण के माध्यम से उन्हें कैसे बेहतर बनाया जा सकता है।
  • अवतार विकास – जैसे विचारों के मिश्रण के आधार पर किन आकृतियों को प्राथमिकता देनी है, इसकी रणनीति बनाना –
    • जहाँ ट्रैकर विफल होता है
    • अंतिम उत्पाद के उपयोग के मामले क्या हैं।
    • सबसे अधिक सौंदर्यपूर्ण क्या होगा
    • सबसे अधिक अर्थपूर्ण क्या है

अभिव्यक्ति विज्ञान, चेहरे की शारीरिक रचना और चेहरे के डेटा के साथ व्यापक कामकाज में मेरी पृष्ठभूमि के आधार पर, मैं आत्मविश्वासपूर्वक कह सकता हूँ कि अशुद्ध डेटा चेहरा ट्रैकिंग में एक प्रमुख समस्या है, न कि एक मामूली। संक्षेप में, भले ही एल्गोरिदम परिपूर्ण हो, समस्याएँ निम्नलिखित कारणों से उत्पन्न होती हैं:

अशुद्ध आरोपित डेटा

  • जब मानव प्रतिभागियों से पोज़ किए गए अभिव्यक्ति डेटा एकत्र किया जाता है, तो डेटा हमेशा दूषित होगा। गारंटी।.
  • अधिकांश लोग हर लक्षित अभिव्यक्ति को सही ढंग से प्रदर्शित नहीं कर सकते। शुद्ध चेहरे की क्रिया संबंधी डेटा मिलना दुर्लभ है। जब प्रतिभागी अशुद्ध अभिव्यक्तियाँ करते हैं, तो इसका कारण या तो वे गलत चेहरे की क्रिया दिखा रहे होते हैं, या वे अतिरिक्त, गैर-लक्षित चेहरे की मांसपेशियों का उपयोग किए बिना लक्षित अभिव्यक्ति को अलग नहीं कर पाते।.
  • सबसे ऊपर, डेटा अधिग्रहणकर्ता अक्सर यह भी नहीं बता सकते कि प्रतिभागी लक्षित अभिव्यक्ति को सही ढंग से बोल भी रहा है या नहीं। यह जानकारी की कमी डेटा अधिग्रहणकर्ताओं की गलती नहीं है, बल्कि कंपनी X की गलत प्राथमिकताओं और सही प्रतिभाओं को भर्ती करने या बनाए रखने में लापरवाही का परिणाम है।.

खराब डेटा लेबलिंग

  • इंजीनियरिंग प्रतिभा पर अत्यधिक ध्यान केंद्रित करने के कारण, कंपनियाँ आमतौर पर डेटा लेबलिंग भूमिकाओं को प्राथमिकता देने की अनदेखी करती हैं। इसके बजाय, एनोटेशन प्रयासों को अक्सर बिना किसी विशेष विशेषज्ञता वाले ठेकेदारों के लिए निर्धारित निम्न-स्तरीय पदों के रूप में माना जाता है।.
  • कम अनुभव के साथ शुरुआत करने वाले ठेकेदार अंततः डेटा के साथ इतनी अच्छी तरह तालमेल बिठा सकते हैं कि विशेषज्ञता हासिल कर लें; हालांकि, ऐसा शायद ही कभी होता है, क्योंकि ठेकेदार लेबलिंग की भूमिकाओं में आम तौर पर उच्च टर्नओवर होता है।.

अनभिज्ञ कला विकल्प

  • कला के लिए तकनीक को समझना और तकनीक के लिए कला को समझना महत्वपूर्ण है। तकनीकी कंपनियों में कला और इंजीनियरिंग के बीच एक चौंकाने वाला अलगाव है। कई मामलों में, अच्छे ट्रैकर स्वयं ट्रैकरों के कारण नहीं बल्कि पर्दे के पीछे अपरिपक्व तकनीक से निपटने के लिए किए गए कलात्मक विकल्पों के कारण अच्छे दिखते हैं। कला और इंजीनियरिंग के बीच की खाई पाटने के लिए अधिक संसाधन निवेश किए जाने चाहिए।.

मेमोजी और झूठी सकारात्मक भौंह नीचे करने पर वापस

जैसा कि इस पोस्ट की शुरुआत में उल्लेख किया गया है, जब भी मेमोजी मेरी मुस्कान को दर्शाने की कोशिश करता है, तो मेरी भौंहों के भीतरी कोनों पर अनावश्यक रूप से भौंहें नीचे झुक जाती हैं। फिर भी, यह अतिरिक्तता विभिन्न प्रकार की मुस्कानों में बनी रहती है।.

नीचे दिया गया चार्ट इस बात का उदाहरण है कि डेटा गुणवत्ता और कला के बीच की परस्पर क्रिया कैसे विभिन्न अभिव्यक्तियों को नकारात्मक रूप से प्रभावित कर सकती है और मुस्कान के साथ भौंहें नीचे झुकाने जैसी समस्याएँ पैदा कर सकती है।.

ध्यान देंबेशक, इसके कई संभावित कारण हो सकते हैं, जिनमें स्वयं एल्गोरिदम से जुड़ी समस्याएँ भी शामिल हैं; हालांकि, यह रूपरेखा एक विशिष्ट परिदृश्य और विशिष्ट परिस्थितियों के सेट को उजागर करने के लिए तैयार की गई है।.

FACS आकारों का उपयोग करके चेहरे की ट्रैकिंग और अवतारों के मुद्दों का आरेख

विस्तार से समझाना

नाक झुर्राने वाला और ऊपरी होंठ उठाने वाला दो चेहरे की क्रियाएँ हैं जो एक जैसी दिखती हैं।.

  • वे अक्सर डेटा संग्रहण स्तर और डेटा लेबलिंग स्तर दोनों पर एक-दूसरे के साथ भ्रमित हो जाते हैं।.
  • क्योंकि तकनीकी कंपनियाँ डेटा गुणवत्ता में ठीक से निवेश नहीं करतीं, वे आमतौर पर ऐसे कर्मचारियों को विकसित नहीं करतीं जो सटीक रूप से पहचान सकें या यह समझा सकें कि अंतर कैसे किया जाए। नाक झुर्रियुक्त और ऊपरी होंठ उठाने वाला.
  • डेटा संग्रहण और डेटा लेबलिंग दोनों में हुई त्रुटियाँ अनदेखी रह जाती हैं, और प्रतिभा ट्रैकिंग त्रुटियों को पकड़ने में असमर्थ रहती है।.

कला में एक सामान्य तकनीक है उपयोग करना ऊपरी होंठ उठाने वाला स्माइल्स के लिए एक कॉम्बो शेप ऐड-ऑन के रूप में।.

  • क्योंकि जब मुस्कान तीव्र होती है तो लिप कॉर्नर पुलर ऊपरी होंठ को उठाता है, इसलिए कई लोग इस हरकत को … का पर्याय मानते हैं। ऊपरी होंठ उठाने वाला. यह इतना सरल नहीं है।.
  • कई कलाकार का उपयोग करते हैं ऊपरी होंठ उठाने वाला के साथ संयोजन करने के लिए आकार होठों का कोना खींचने वाला एक दमकती मुस्कान बनाने के लिए।. और विवरण यहाँ।.
  • सौंदर्य और सटीकता संबंधी मुद्दों को एक तरफ रख दें, तो भी एक स्पष्ट समस्या बनी हुई है: यदि ऊपरी होंठ उठाने वाला से जुड़ा हुआ है नाक पर झुर्रियाँ डालने वाला, जब एक मजबूत मुस्कान आरंभ होती है, तो यह सक्रिय हो जाएगी। ऊपरी होंठ उठाने वाला, जो तब सक्रिय हो जाएगा नाक झुर्रियुक्त. इसलिए, जब कोई मुस्कुराता है, तो उसकी भौहें नीचे हो जाती हैं। बुरा।.

डेटा गुणवत्ता पर पर्याप्त ध्यान नहीं दिया जाता है।.
कला को पर्याप्त श्रेय नहीं दिया जाता।.

समस्या का समाधान

सबसे सरल समाधान? FACS से दूर रहें और चेहरे की शारीरिक रचना पर निर्भर रहें।. गलत सकारात्मक भौंह नीचे लाने को कम करने का सबसे आसान समाधान via नाक झुर्रियुक्त और ऊपरी होंठ उठाने वाला इन क्रियाओं के पीछे की मांसपेशियों के गुणों का सम्मान करना है।.

शारीरिक रचना की दृष्टि से, न तो लेवेटर पाल्पेब्रे सुपीरियरीस (ऊपरी होंठ उठाने वाला मांसपेशी) न ही लेवेटर पलपेब्रे सुपीरियरीस एलाके नासी (नाक झुर्रियुक्त मांसपेशी) भौंहों को नीचे करती है। FACS फेशियल कोडिंग नियमों की सीमाओं के भीतर ही भौंहों को नीचे करना नाक पर झुर्रियाँ पड़ने से जुड़ा होता है।. 

यदि आप बस निम्नलिखित करें तो आप खुद को सिरदर्द से बचा सकते हैं:

  1. अपने लेबलिंग नियमों को फिर से डिज़ाइन करें ताकि भौंह उठाने को एक अलग क्रिया के रूप में वर्गीकृत किया जा सके। नाक झुर्रियुक्त
  2. एक की मेजबानी करने के लिए अपने ब्लेन्डशेप्स को फिर से डिज़ाइन करें नाक झुर्रियुक्त बिना स्वाभाविक रूप से भौंहें चढ़ाए

टिप्पणी करें

यह साइट स्पैम कम करने के लिए अकिस्मेट का उपयोग करती है। जानें कि आपकी टिप्पणी डेटा कैसे संसाधित किया जाता है।

स्टूडियो और टीमों के लिए डिज़ाइन किया गया

चलो बात करें।.

facetheFACS@melindaozel.com