في عالمنا الرقمي الذي يركّز على المستهلك، صنعنا حاجة ملحة للابتكار وتطوير المنتجات الناشئة. فمع انتشار التعلم الآلي والضغط الذاتي المستمر للتحرك بسرعة وكسر - أعني "بناء" - الأشياء، أصبحت شركات التكنولوجيا الكبرى في حاجة دائمة إلى بناة. ونتيجةً لذلك، أصبح مهندسو البرمجيات سلعة مرغوبة للغاية، حيث يهيمنون على عدد الموظفين ويثيرون حروب المزايدة بين الشركات. ولكن، مع نمو طموحات التعلم الآلي، تنمو الاحتياجات من البيانات أيضًا، مما يحول المشاكل التي تتمحور حول المهندسين إلى مشاكل متعددة التخصصات. تتطلب المشاريع التي تسفر عن بيانات شديدة الغموض - مثل تعابير الوجه لتتبع الوجوه - فهمًا للبيانات خارج نطاق الهندسة؛ فهي تتطلب تزاوجًا متعدد التخصصات بين الهندسة والمجال المكمل الذي يتم تطبيقه. لذلك، من الأهمية بمكان أن تتحمل شركات التكنولوجيا مسؤولية سلامة البيانات من خلال دمج الخبراء الميدانيين في عملية تطوير المنتج.
في حين أنه ليس من ثقافة شركات التكنولوجيا الكبرى إعطاء الأولوية للأدوار غير الهندسية، إلا أن الصناعات الأخرى تعترف بأهمية الخبرة الموضعية في مجال التعلم الآلي. فمجال التكنولوجيا الحيوية، على سبيل المثال، يعتمد على التعاون بين كل من الخبراء الطبيين و المهندسين. في هذه الحالة، تكون الحاجة إلى التعاون واضحة، ولكن في مجالات التخصص الأكثر غموضًا، لا تكون الحاجة واضحة دائمًا. وكما تمت الإشارة إليه سابقاً، فإن أحد المجالات الرئيسية التي تعاني من الغموض وعدم الفهم هو تتبع الوجه. تعتبر حالات الاستخدام الشائعة لتتبع الوجه - بما في ذلك مرشحات الوجه، واكتشاف الملامح للإعلان عن المنتجات (مثل اكتشاف الشفاه لاختبار منتجات أحمر الشفاه أو اكتشاف العينين للنظارات) والصور الرمزية - حميدة نسبيًا. ومع ذلك، عند النظر في حالات الاستخدام الأقل "لطافة" مثل الكشف عن المشاعر، ومراقبة السلوك، والكشف عن الخداع مع تطبيقات في نظام العدالة الجنائية أو قطاع التأمين أو عالم الأمن السيبراني - يصبح أداء نموذج التعلم الآلي مثيرًا للجدل؛ وإذا تم القيام به بطريقة خاطئة، يصبح خطيرًا. هناك بالفعل العديد من المشكلات المعروفة في تقنية التعرّف على الوجه واستخدامها غير المنظم في مختلف البلدان والقطاعات. وبما أن تتبع تعابير الوجه لا يقتصر على مجرد تحديد هوية الشخص، بل يراقب ويستخلص استنتاجات حول سلوك ذلك الشخص، فإن لديه القدرة على أن يكون أكثر تطفلاً.
على الرغم من الأهمية الأساسية لبيانات التعابير في تتبع الوجوه، إلا أن شركات التكنولوجيا الكبرى غالباً ما تفشل في إعطاء الأولوية لجودة بيانات التعابير. فعادة ما يعتمد مديرو المنتجات والمديرون الهندسيون والباحثون في مجال المستخدمين ومهندسو البرمجيات على فهمهم السطحي وعمليات البحث المخصصة بدلاً من الاستفادة من الفهم العميق الذي يمكن أن يقدمه خبير. وعلى الرغم من أن مهندسي البرمجيات بارعون في إنشاء الخوارزميات، إلا أنهم غالباً ما يمتلكون معرفة سطحية بما يدخل في البيانات. وبالنظر إلى عبء العمل الضاغط عليهم وتركيزهم على معارفهم المتخصصة، ليس من المجدي للمهندسين تطوير خبرة إضافية في التدقيق في بيانات التعبير الدقيقة أو إتقان المفاهيم المعقدة في أبحاث المشاعر.
إن تحديد نوع البيانات المطلوبة، وكيفية جمعها، وكيفية تصنيفها هو عملية حساسة. إذا اخترت استهداف البيانات الخاطئة، فلن يهم مدى جودة جمعها أو تصنيفها. إذا استهدفت بيانات مفيدة ولكنك جمعتها بشكل غير صحيح، فستفشل أيضًا. ستفشل مرة أخرى إذا لم تقم بتسميتها بدقة و/أو بدقة. نظرًا للاختلافات المورفولوجية في ملامح الوجه، والتحيزات المتأصلة في تفسير التعابير، والجدل الدائر بين كل من الباحثين في مجال العاطفة وعلماء تشريح الوجه، يجب على أي مجموعة تطور خوارزميات تتبع الوجه بنوايا تتجاوز مجرد تجربة أحمر الشفاه قبل الشراء أن تقبل المساءلة والمسؤولية الأخلاقية عن سلامة البيانات.
فبدلاً من التأكد من أن اللبنات الأساسية لخوارزمياتهم مفهومة جيدًا من قبل أولئك الذين يستخدمونها، فإن الحالة المؤسفة للتكنولوجيا الكبيرة هي جمع أو الحصول على كميات هائلة من البيانات وتمريرها إلى جهات خارجية لوضع العلامات. وعادةً ما يتم الاستعانة بمصادر خارجية للملصقات أو التعاقد معها ودائمًا ما تكون هذه الجهات التي تقوم بوضع العلامات أقل من قيمتها الحقيقية. ولمراقبة جودة الملصقات، فإن المعيار هو إنشاء مؤشرات الأداء الرئيسية المختلفة وتطبيقها، ولكن لأن شركات التكنولوجيا الكبرى تختار عدم استثمار الموارد في الأشخاص الذين يمكنهم الإشراف بشكل شرعي على جودة البيانات المتقدمة، فإن مؤشرات الأداء الرئيسية تكون بشكل عام اعتباطية ولا تحمل الكثير من الجدارة. وما يزيد المشكلة تعقيداً هو أنه إذا لم يكن المهندسون مجهزين بعمق الفهم المناسب لتحديد الحقائق الأساسية، فما الذي يقيسونه بالفعل؟ هناك التعلم غير الخاضع للإشراف. وهناك الهندسة غير الخاضعة للإشراف.
عندما كنت أعمل في إحدى الشركات الخمس الكبرى في وادي السيليكون، صُدمت باستمرار بالعقلية غير المبالية فيما يتعلق ببيانات تتبع الوجوه المعقدة. وعلى الرغم من أن زملائي كانوا عقولاً رائدة في تطوير الخوارزميات، إلا أنهم كانوا يمتلكون فهماً ضحلاً لتشريح الوجه والمفاهيم الأساسية للمشاعر والسلوك التعبيري. ومثل أي موضوع آخر شديد التخصص، فإن فهم الفروق الدقيقة في التعبير البشري يستغرق سنوات من الدراسة والخبرة المكثفة. وعلى الرغم من حقيقة أنني كنت الخبير المقيم في مجال تعابير الوجه الذي كرّست حياتي ومسيرتي المهنية لفهم الفروق الدقيقة في الوجه البشري، إلا أنني كنت أُستبعد بانتظام من الاجتماعات وجلسات التخطيط المهمة. وغالباً ما كنت أجد زملائي في العمل يبحثون بشكل عشوائي في صفحات مرجعية قديمة وغير دقيقة عن تعبيرات الوجه (وأنا حالياً توفير حلول جديدة لـ) في محاولات لاختراق خطة خط أنابيب البيانات. وكثيراً ما أُحيلت خبرتي إلى دور إشرافي، وأُسيء استخدام مهاراتي في مهام غير ذات صلة مثل تصنيف أنواع اللحية ولون الشعر. وعندما كنت ألاحظ وجود تناقضات في البيانات أو أتنبأ بوجود مشكلات في الأجهزة، كنت أجلس وأُعرض عليّ درساً في "كيفية عمل التعلم الآلي".
أرى العديد من قوائم الوظائف تطلب خبرة X سنة في تتبع الوجوه، ولكن طلب خبرة ذات صلة لا يكفي. فكما أن العمل السابق للمهندس في مجال التكنولوجيا الطبية لا يؤهله لأن يكون طبيباً، فإن مجرد العمل على تكنولوجيا التتبع لا يؤهل المهندس ليكون خبيراً في تعابير الوجه أو المشاعر. إذا كان هناك المزيد من التركيز على توظيف الخبراء المناسبين، فربما يتم التخفيف من حدة المعاناة في العثور على مهندسين ذوي خبرات نادرة ومحددة؛ ويمكن أن يؤدي هذا التخفيف إلى إفساح المجال لمزيد من التعاون المبتكر بين الهندسة والتخصصات التكميلية التي يمكن أن تقترن بها.
إن تركيز شركات التكنولوجيا الكبرى على الرؤية النفقية للهندسة عادة مهملة يجب أن تتغير. وفي حين أن مهندسي البرمجيات أساسيون بالفعل في عملية التعلم الآلي، إلا أن طموحات التعلم الآلي أوصلتنا إلى نقطة يجب أن ندرك فيها الحاجة إلى العمل متعدد التخصصات. لا ينبغي الاستخفاف بالبيانات الخاصة بالأنظمة التي تعتمد على الفروق الدقيقة - خاصةً عندما تنزف إمكانية استخدام حالات الاستخدام الجائرة. إذا كانت الشركات تقدّر الخبرة في مجال البيانات بنفس التبجيل والدعم الذي تحظى به الخبرة الهندسية في مجال البيانات، فإن الخوارزميات و ستكون البيانات التي تُبنى منها أكثر شمولاً وأقل عرضة للخطأ. سيؤدي عدم وجود أنظمة بيانات شاملة إلى تركنا مع منتجات غير منظمة عرضة للتحيز. سيؤدي عدم التوازن في الاستثمار المنحرف نحو الخوارزميات وبعيدًا عن جودة البيانات إلى إهدار الجهد الهندسي والمنتجات الناقصة وانتشار التكنولوجيا غير الأخلاقية.
لا تضع جميع موظفيك في سلة واحدة. وظّف بمسؤولية.
رأي واحد حول “Big Tech’s Homogeneous Hiring Habits Are Harming Our Data”