हमारी उपभोक्ता-केंद्रित डिजिटल दुनिया में, हमने नवाचार करने और उभरते उत्पादों को विकसित करने की एक तात्कालिकता पैदा कर ली है। मशीन लर्निंग के चलन में होने और तेजी से आगे बढ़ने तथा चीजों को बनाने - मेरा मतलब है “निर्मित करने” - के एक आत्म-परिपूरक दबाव के साथ, बिग टेक को लगातार निर्माताओं की आवश्यकता है। परिणामस्वरूप, सॉफ्टवेयर इंजीनियर एक अत्यधिक वांछित वस्तु बन गए हैं, जो कर्मचारियों की संख्या पर हावी हैं और कंपनियों के बीच बोली युद्ध को भड़का रहे हैं। हालांकि, जैसे-जैसे मशीन लर्निंग की महत्वाकांक्षाएं बढ़ती हैं, डेटा की ज़रूरतें भी बढ़ती हैं, जिससे इंजीनियर-केंद्रित समस्याएं बहु-विषयक मामलों में बदल जाती हैं। अत्यधिक अस्पष्ट डेटा देने वाले प्रोजेक्ट - जैसे कि फेस ट्रैकिंग के लिए चेहरे के हाव-भाव - इंजीनियरिंग के दायरे से परे डेटा की समझ की मांग करते हैं; वे इंजीनियरिंग और लागू किए जा रहे पूरक क्षेत्र के बीच एक बहु-विषयक गठजोड़ की मांग करते हैं। इसलिए, तकनीकी फर्मों के लिए यह महत्वपूर्ण है कि वे उत्पाद विकास प्रक्रिया में क्षेत्र विशेषज्ञों को शामिल करके डेटा की अखंडता की जिम्मेदारी लें।.
हालांकि बिग टेक की संस्कृति में गैर-इंजीनियरिंग भूमिकाओं को प्राथमिकता देना आम नहीं है, अन्य उद्योग मशीन लर्निंग में विषयगत विशेषज्ञता के महत्व को स्वीकार करते हैं। उदाहरण के लिए, बायोटेक क्षेत्र चिकित्सा विशेषज्ञों के सहयोग पर निर्भर करता है। और इंजीनियरों। इस मामले में, सहयोग की आवश्यकता स्पष्ट है, लेकिन विशेषज्ञता के अधिक अस्पष्ट क्षेत्रों में, यह आवश्यकता हमेशा स्पष्ट नहीं होती है। जैसा कि पहले उल्लेख किया गया है, एक प्रमुख क्षेत्र जो अस्पष्टता और समझ की कमी से पीड़ित है, वह है चेहरा ट्रैकिंग। चेहरा ट्रैकिंग के सामान्य उपयोग के मामले – जिसमें फेस फिल्टर, उत्पाद विज्ञापन के लिए विशेषता का पता लगाना (जैसे लिपस्टिक उत्पादों का परीक्षण करने के लिए होंठ का पता लगाना या चश्मे के लिए आंख का पता लगाना) और अवतार शामिल हैं – अपेक्षाकृत हानिरहित हैं। हालांकि, जब भावना का पता लगाने, व्यवहार की निगरानी, और धोखाधड़ी का पता लगाने जैसे कम “प्यारे” उपयोग के मामलों पर विचार किया जाता है, जिनके अनुप्रयोग आपराधिक न्याय प्रणाली, बीमा क्षेत्र, या साइबर सुरक्षा की दुनिया में हैं - तो एक मशीन लर्निंग मॉडल का प्रदर्शन विवादास्पद हो जाता है; और यदि इसे गलत तरीके से किया जाए, तो यह खतरनाक हो जाता है। चेहरे की पहचान तकनीक और विभिन्न देशों और उद्योगों में इसके अनियंत्रित उपयोग से पहले से ही कई ज्ञात समस्याएं हैं। चूंकि चेहरे के हाव-भाव की ट्रैकिंग केवल किसी व्यक्ति की पहचान नहीं करती है, बल्कि उस व्यक्ति के व्यवहार का अवलोकन करती है और उसके बारे में निष्कर्ष निकालती है, इसलिए इसमें कहीं अधिक घुसपैठ करने की क्षमता है।.
चेहरे को ट्रैक करने के लिए अभिव्यक्ति डेटा के मौलिक महत्व के बावजूद, बिग टेक अक्सर अभिव्यक्ति डेटा की गुणवत्ता को प्राथमिकता देने में विफल रहता है। उत्पाद प्रबंधक, इंजीनियरिंग प्रबंधक, उपयोगकर्ता शोधकर्ता और सॉफ्टवेयर इंजीनियर आमतौर पर विशेषज्ञ द्वारा प्रदान की जा सकने वाली समझ की गहराई से लाभ उठाने के बजाय अपनी सतही समझ और आकस्मिक खोजों पर निर्भर करते हैं। हालांकि सॉफ्टवेयर इंजीनियर एल्गोरिदम बनाने में माहिर होते हैं, लेकिन उनके पास अक्सर इस बात का केवल सतही ज्ञान होता है कि डेटा में क्या शामिल होता है। उनके उच्च-दबाव वाले कार्यभार और अपनी विशेषज्ञता पर ध्यान केंद्रित करने के कारण, इंजीनियरों के लिए सूक्ष्म अभिव्यक्ति डेटा की बारीकी से जांच करने या भावना अनुसंधान में जटिल अवधारणाओं में महारत हासिल करने में अतिरिक्त विशेषज्ञता विकसित करना व्यावहारिक नहीं है।.
यह निर्धारित करना कि किस प्रकार के डेटा की आवश्यकता है, इसे कैसे एकत्रित किया जाए, और इसे कैसे लेबल किया जाए, एक नाजुक प्रक्रिया. यदि आप गलत डेटा को लक्षित करते हैं, तो इससे कोई फर्क नहीं पड़ेगा कि आप उसे कितनी अच्छी तरह एकत्रित या लेबल करते हैं। यदि आप उपयोगी डेटा को लक्षित करते हैं लेकिन उसे ठीक से एकत्रित नहीं करते हैं, तो वह भी विफल हो जाएगा। यदि आप इसे सटीक और/या सही ढंग से लेबल नहीं करते हैं, तो यह फिर से विफल हो जाएगा। चेहरे की विशेषताओं में संरचनात्मक भिन्नताओं, अभिव्यक्ति की व्याख्या में अंतर्निहित पूर्वाग्रहों, और भावना शोधकर्ताओं तथा चेहरे के शारीरिक रचना विशेषज्ञों दोनों के बीच विवाद के कारण, कोई भी समूह जो 'ट्राई-बिफोर-यू-बाय' लिपस्टिक से परे इरादों के साथ फेस ट्रैकिंग एल्गोरिदम विकसित कर रहा है, उसे डेटा की अखंडता के लिए जवाबदेही और नैतिक जिम्मेदारी स्वीकार करनी चाहिए।.
उनके एल्गोरिदम के मूलभूत घटकों को उपयोग करने वालों द्वारा अच्छी तरह से समझा जाए यह सुनिश्चित करने के बजाय, बिग टेक की दुर्भाग्यपूर्ण स्थिति यह है कि वे बड़ी मात्रा में डेटा एकत्र या प्राप्त करते हैं और इसे तीसरे पक्ष के लेबलर को सौंप देते हैं। लेबलर आमतौर पर आउटसोर्स्ड, अनुबंध पर होते हैं, और लगभग हमेशा कम आंके जाते हैं। लेबल की गुणवत्ता की निगरानी के लिए, मानक विभिन्न प्रमुख प्रदर्शन संकेतक, या KPI, बनाना और लागू करना है, लेकिन चूंकि बिग टेक उन्नत डेटा की गुणवत्ता की वैध रूप से निगरानी करने में सक्षम लोगों में संसाधन निवेश नहीं करना चुनती है, इसलिए KPI आम तौर पर मनमाने होते हैं और उनमें बहुत कम औचित्य होता है। समस्या को और बढ़ाते हुए, यदि इंजीनियरों के पास ग्राउंड ट्रूथ की पहचान करने के लिए पर्याप्त गहरी समझ नहीं है, तो वे वास्तव में क्या माप रहे हैं? अनुपेक्षित शिक्षण होता है। और फिर अनुपेक्षित इंजीनियरिंग होती है।.
जब मैं सिलिकॉन वैली की बिग फाइव कंपनियों में से एक के लिए काम करता था, तो मैं जटिल फेस ट्रैकिंग डेटा के प्रति लापरवाह मानसिकता से लगातार हैरान रहता था। हालांकि मेरे सहकर्मी एल्गोरिदम विकास में अग्रणी थे, लेकिन उन्हें चेहरे की संरचना, मूल भावनात्मक अवधारणाओं और अभिव्यक्ति के व्यवहार की सतही समझ थी। किसी भी अन्य अत्यधिक विशेषज्ञता वाले विषय की तरह, मानव अभिव्यक्ति की बारीकियों को समझने में वर्षों का गहन अध्ययन और अनुभव लगता है। इस तथ्य के बावजूद कि मैं चेहरे के भावों का विशेषज्ञ था, जिसने मानव चेहरे की बारीकियों को समझने के लिए अपना जीवन और करियर समर्पित कर दिया था, मुझे नियमित रूप से महत्वपूर्ण बैठकों और योजना सत्रों से बाहर रखा जाता था। मैं अक्सर सहकर्मियों को बेतरतीब ढंग से पुराने और गलत अभिव्यक्ति संदर्भ पृष्ठों को खंगालते हुए पकड़ता था (जिन्हें मैं वर्तमान में यहाँ के लिए नए समाधान प्रदान करनाडेटा पाइपलाइन की योजना को झटपट तैयार करने के प्रयासों में। मेरी विशेषज्ञता को अक्सर पर्यवेक्षी भूमिका तक सीमित कर दिया जाता था, और मेरी क्षमताओं का दुरुपयोग दाढ़ी के प्रकार और बालों के रंग जैसी अप्रासंगिक गतिविधियों में किया जाता था। जब मैंने डेटा असंगतियों में रुझानों को चिह्नित किया या हार्डवेयर समस्याओं की पूर्वसूचना दी, तो मुझे बैठाकर “मशीन लर्निंग कैसे काम करती है” का पाठ पढ़ाया गया।”
मैं कई नौकरी विज्ञापनों में फेस ट्रैकिंग में X वर्षों के अनुभव की मांग देखता हूँ, लेकिन संबंधित अनुभव की मांग करना ही पर्याप्त नहीं है। जैसे एक इंजीनियर का चिकित्सा प्रौद्योगिकी में पिछला काम उन्हें चिकित्सक बनने के लिए योग्य नहीं बनाता, वैसे ही केवल ट्रैकिंग तकनीक पर काम करने से कोई इंजीनियर चेहरे के भावों या भावनाओं का विशेषज्ञ नहीं बन जाता। यदि उपयुक्त विशेषज्ञों की भर्ती पर अधिक ध्यान दिया जाता, तो शायद दुर्लभ और विशिष्ट अनुभव वाले इंजीनियरों को खोजने की चुनौती कम हो जाती; इस कमी से इंजीनियरिंग और उससे जुड़ी पूरक शाखाओं के बीच अधिक नवोन्मेषी सहयोग के लिए जगह बन सकती है।.
बिग टेक का इंजीनियरिंग पर संकीर्ण ध्यान एक लापरवाही भरी आदत है जिसे बदलने की जरूरत है। हालांकि सॉफ्टवेयर इंजीनियर वास्तव में मशीन लर्निंग प्रक्रिया के लिए आवश्यक हैं, मशीन लर्निंग की महत्वाकांक्षाओं ने हमें उस बिंदु पर पहुंचा दिया है जहाँ हमें अंतःविषय कार्रवाई की आवश्यकता को पहचानना होगा। सूक्ष्मताओं पर निर्भर प्रणालियों के लिए डेटा को हल्के में नहीं लिया जाना चाहिए – विशेषकर जब उनमें घुसपैठ वाले उपयोग मामलों की संभावनाएँ मौजूद हों। यदि कंपनियाँ डेटा विषय-वस्तु में विशेषज्ञता को उसी सम्मान और समर्थन के साथ महत्व देतीं, जैसा वे इंजीनियरिंग विशेषज्ञता को देती हैं, तो एल्गोरिदम और जिन डेटा से इन्हें बनाया जाता है, वे अधिक व्यापक और कम त्रुटिपूर्ण होंगे। समग्र डेटा प्रणालियों की कमी हमें पक्षपात के प्रति संवेदनशील अनियंत्रित उत्पादों के साथ छोड़ देगी। एल्गोरिदम की ओर झुका हुआ और डेटा गुणवत्ता से दूर निवेश का असंतुलन व्यर्थ इंजीनियरिंग प्रयास, दोषपूर्ण उत्पाद और अनैतिक तकनीक के प्रसार का कारण बनेगा।.
अपनी सभी भर्तियों को एक ही टोकरी में न रखें। जिम्मेदारी से भर्ती करें।.
“Big Tech’s Homogeneous Hiring Habits Are Harming Our Data” पर 1 विचार”