У нашем дигиталном свету усмереном на потрошаче, створили смо хитност за иновацијама и развојем нових производа. Са трендом машинског учења и самоодржавајућим притиском да се креће брзо и “пуца” – мислим "гради" – ствари, велике технолошке компаније су у сталном потражњи за градитељима. Као резултат тога, софтверски инжењери су постали веома тражена роба, доминирајући бројем запослених и изазивајући ратове надметања међу компанијама. Међутим, како расту амбиције у машинском учењу, расту и потребе за подацима, претварајући инжењерске проблеме у међудисциплинарна питања. Пројекти који генеришу веома неодређене податке – попут израза лица за праћење лица – захтевају разумевање података изван инжењерског домена; они налажу међудисциплинарни спој између инжењеринга и примењене комплементарне области. Стога је од кључног значаја да технолошке компаније преузму одговорност за интегритет података укључивањем стручњака из одговарајућих области у процес развоја производа.
Иако у култури великих технолошких компанија није уобичајено да се даје предност неинжењерским улогама, друге индустрије признају важност стручности у одређеним областима у машинском учењу. Биотечна индустрија, на пример, ослања се на сарадњу између медицинских стручњака и инжењери. У овом случају потреба за сарадњом је очигледна, али у мање познатим областима специјализације та потреба није увек јасна. Као што је раније поменуто, једна велика област која пати од нејасноће и недостатка разумевања је праћење лица. Уобичајени случајеви употребе праћења лица – укључујући филтере за лице, детекцију карактеристика за оглашавање производа (нпр. детекција усана за тестирање ружева или детекција очију за наочаре) и аватаре – су релативно безазлени. Међутим, када се разматрају мање “слатки” случајеви употребе као што су детекција емоција, праћење понашања и откривање обмане са применом у кривичном правосудном систему, осигуравајућем сектору или свету сајбер безбедности – перформансе модела машинског учења постају спорне; а ако се спроведу на погрешан начин, постају опасне. Већ постоји много познатих проблема са технологијом препознавања лица и њеном нерегулисаном употребом у различитим земљама и индустријама. Пошто праћење израза лица не само да идентификује особу, већ посматра и извлачи закључке о понашању те особе, оно може бити далеко инвазивније.
Упркос основној важности података о изразима за праћење лица, велике технолошке компаније често не дају приоритет квалитету тих података. Менаџери производа, инжењерски менаџери, истраживачи корисника и софтверски инжењери обично се ослањају на своје површно разумевање и ад хок претраге, уместо да искористе дубље разумевање које би могао пружити стручњак. Иако су софтверски инжењери мајстори у креирању алгоритама, они често имају само површно знање о томе шта све улази у податке. С обзиром на њихов рад под великим притиском и фокус на сопствено специјализовано знање, инжењерима није изводљиво да развију додатну експертизу у прецизној анализи суптилних података о изразима лица или да савладају сложене концепте из истраживања емоција.
Одређивање које врсте података су потребне, како их прикупити и како их означити јесте осетљив процес. Ако одлучите да циљате погрешне податке, неће бити важно колико добро их прикупите или означите. Ако циљате корисне податке, али их неправилно прикупите, то ће такође пропасти. Поново ће пропасти ако их не означите прецизно и/или тачно. Због морфолошких разлика у облику лица, урођених пристрасности у тумачењу израза и контроверзија међу истраживачима емоција и анатомиста лица, свака група која развија алгоритме за праћење лица са намерама које превазилазе "пробај пре куповине" ружа за усне мора прихватити одговорност и етичку обавезу за интегритет података.
Уместо да обезбеде да корисници добро разумеју основне компоненте њихових алгоритама, несрећна пракса великих технолошких компанија јесте да прикупљају или набављају огромне количине података и предају их трећим странама за означавање. Означавачи се обично ангажују спољним сарадницима по уговору и готово увек су потцењени. Да би се пратила квалитета етикета, стандард је да се креирају и спроводе разни кључни показатељи учинка, или KPI-ови, али пошто Big Tech не улаже ресурсе у људе који могу легитимно да надгледају квалитет напредних података, ти KPI-ови су углавном произвољни и имају мало значаја. Штавише, ако инжењери нису адекватно опремљени дубинским разумевањем да идентификују истинске основе, шта они заправо мере? Постоји учење без надзора. А онда постоји инжењеринг без надзора.
Када сам радио у једној од пет највећих компанија у Силиконској долини, стално сам био запрепашћен неформалним ставом према сложеним подацима о праћењу лица. Иако су моји колеге били водећи умови у развоју алгоритама, имали су плитко разумевање анатомије лица, основних концепата емоција и понашања израза. Као и свака друга високо специјализована област, разумевање нијанси људског израза захтева године интензивног проучавања и искуства. Упркос чињеници да сам био резидентни стручњак за изразе лица који је свој живот и каријеру посветио разумевању нијанси људског лица, редовно су ме искључивали са важних састанака и сесија планирања. Често сам затицао колеге како насумично прелиставају застареле и нетачне странице са референцама за изразе (које ја тренутно пружање нових решења за овде) у покушајима да склепам план за податочни цевовод. Моја експертиза је често била сведена на надзорниčku улогу, а моје вештине су злоупотребљаване на небитним задацима попут класификације типова брада и боје косе. Када бих истакао трендове у недоследностима података или предвидео проблеме са хардвером, седео бих и добијао лекцију о томе “како функционише машинско учење”.”
Видим много огласа за посао који траже X година искуства у праћењу лица, али тражити сродно искуство није довољно. Као што инжењерово претходно искуство у медицинској технологији не квалификује га за медицинског практичара, тако ни само искуство у технологији праћења не чини инжењера стручњаком за изразе лица или емоције. Кад би се више пажње посвећивало запошљавању одговарајућих стручњака, можда би се ублажила борба за инжењере са ретким и специфичним искуством; такво ублажавање могло би отворити простор за иновативнију сарадњу између инжењеринга и комплементарних дисциплина са којима се може комбиновати.
Тесна визија великих технолошких компанија усмерена на инжењеринг је немаран навика која мора да се промени. Иако су софтверски инжењери заиста неопходни у процесу машинског учења, амбиције у области машинског учења довеле су нас до тачке у којој морамо препознати потребу за међудисциплинарном акцијом. Подаци за системе који зависе од нијанси не смеју се узимати олако – посебно када носе потенцијал за инвазивне примене. Ако би компаније вредновале стручност у области података са истом поштовањем и подршком као што то чине са инжењерском стручношћу, алгоритми и Подаци на основу којих су изграђени били би свеобухватнији и мање погрешни. Недостатак холистичких система података оставиће нас са нерегулисаним производима подложним пристрасности. Неуравнотеженост улагања усмерена ка алгоритмима, а не ка квалитету података, довешће до расипања инжењерских напора, недовољних производа и ширења неетičке технологије.
Не стављајте све своје запослене у једну корпу. Запошљавајте одговорно.
Мишљење 1ТП1Т о “1ТП2Т”