Homogenní náborové zvyklosti velkých technologických firem poškozují naše data

V našem digitálním světě zaměřeném na spotřebitele jsme vytvořili naléhavou potřebu inovovat a vyvíjet nové produkty. S trendem strojového učení a samovolným tlakem na rychlý pohyb a rozbíjení - chci říct "budování" - věcí potřebují velké technologické firmy neustále konstruktéry. V důsledku toho se softwaroví inženýři stali velmi žádaným zbožím, které dominuje počtu zaměstnanců a podněcuje nabídkové války napříč společnostmi. S rostoucími ambicemi v oblasti strojového učení však rostou i potřeby v oblasti dat, což mění problémy zaměřené na inženýry v mezioborové záležitosti. Projekty, které přinášejí velmi nejednoznačná data - jako například výrazy obličeje pro sledování obličeje - vyžadují porozumění datům přesahující rámec inženýrství; vyžadují mezioborové spojení mezi inženýrstvím a doplňkovým oborem, který je aplikován. Proto je pro technologické firmy zásadní, aby převzaly odpovědnost za integritu dat zapojením odborníků z oboru do procesu vývoje produktu.

Ačkoli v kultuře velkých technologických firem není upřednostňování jiných než inženýrských rolí, ostatní odvětví uznávají důležitost aktuálních odborných znalostí v oblasti strojového učení. Například oblast biotechnologií se spoléhá na spolupráci jak lékařských odborníků a inženýři. V tomto případě je potřeba spolupráce zřejmá, ale v nejasnějších oblastech specializace není vždy zřejmá. Jak již bylo zmíněno dříve, jednou z hlavních oblastí, která trpí nejasností a nepochopením, je sledování obličejů. Běžné případy použití sledování obličeje - včetně obličejových filtrů, detekce rysů pro reklamu na produkty (např. detekce rtů pro testování rtěnek nebo detekce očí pro brýle) a avatarů - jsou relativně neškodné. Pokud však uvažujeme o méně "roztomilých" případech použití, jako je detekce emocí, sledování chování a detekce podvodů s aplikacemi v systému trestního soudnictví, pojišťovnictví nebo ve světě kybernetické bezpečnosti - výkon modelu strojového učení se stává sporným; a pokud se provádí nesprávným způsobem, stává se nebezpečným. S technologií rozpoznávání obličeje a jejím neregulovaným používáním v různých zemích a odvětvích je již známo mnoho problémů. Vzhledem k tomu, že sledování výrazu obličeje neumožňuje pouhou identifikaci osoby, ale spíše ji pozoruje a vyvozuje z ní závěry o jejím chování, může být mnohem invazivnější.

Navzdory zásadnímu významu výrazových dat pro sledování obličeje se v oblasti velkých technologií často nepřikládá priorita kvalitě výrazových dat. Produktoví manažeři, inženýři, uživatelští výzkumníci a softwaroví inženýři se běžně spoléhají na své vlastní povrchní znalosti a ad hoc vyhledávání, místo aby využili hloubku znalostí, kterou by jim mohl poskytnout odborník. Softwaroví inženýři jsou sice mistry ve vytváření algoritmů, ale často mají jen povrchní znalosti o tom, co do dat patří. Vzhledem k jejich vysokému pracovnímu vytížení a zaměření na vlastní specializované znalosti není pro inženýry reálné, aby si vytvořili další odborné znalosti v oblasti pečlivého zkoumání jemných výrazových dat nebo zvládnutí složitých konceptů v oblasti výzkumu emocí.

Určit, jaký typ dat je potřeba, jak je shromažďovat a jak je označovat, je velmi obtížné. choulostivý proces. Pokud se rozhodnete zaměřit na špatné údaje, nezáleží na tom, jak dobře je shromažďujete nebo označujete. Pokud se zaměříte na užitečná data, ale shromáždíte je nevhodně, také se to nepodaří. Ještě více selže, pokud je neoznačíte přesně a/nebo nepřesně. Vzhledem k morfologickým rozdílům v rysech obličeje, přirozeným zkreslením při interpretaci výrazů a kontroverzím mezi výzkumníky emocí i anatomy obličeje musí každá skupina vyvíjející algoritmy pro sledování obličeje se záměry přesahujícími rámec "vyzkoušej, než si koupíš rtěnku" přijmout odpovědnost a etickou odpovědnost za integritu dat.

Nešťastným stavem velkých technologií je sběr nebo získávání velkého množství dat a jejich předávání třetím stranám, které je označují, namísto toho, aby zajistily, že základním stavebním kamenům jejich algoritmů dobře rozumí ti, kdo je používají. Tito štítkovači jsou obvykle externí, na základě smlouvy a téměř vždy podhodnoceni. Pro sledování kvality štítkovačů se standardně vytvářejí a prosazují různé klíčové ukazatele výkonnosti neboli KPI, ale protože se Big Tech rozhodl neinvestovat prostředky do lidí, kteří by mohli legitimně dohlížet na kvalitu pokročilých dat, jsou KPI obvykle libovolné a mají jen malou hodnotu. Problém dále prohlubuje skutečnost, že pokud inženýři nejsou náležitě vybaveni hloubkou znalostí, aby mohli identifikovat základní pravdy, co vlastně měří? Existuje učení bez dohledu. A pak je tu neřízené inženýrství.

Když jsem pracoval pro jednu z velkých pěti společností v Silicon Valley, byl jsem neustále šokován nonšalantním přístupem ke složitým údajům o sledování obličeje. Přestože moji kolegové byli špičkovými odborníky na vývoj algoritmů, měli jen povrchní znalosti o anatomii obličeje, základních pojmech emocí a výrazovém chování. Stejně jako u jiných vysoce specializovaných oborů vyžaduje pochopení nuancí lidského výrazu roky intenzivního studia a zkušeností. Přestože jsem byl hlavním odborníkem na výraz obličeje, který zasvětil svůj život a kariéru pochopení nuancí lidské tváře, byl jsem pravidelně vylučován z důležitých schůzek a plánovacích zasedání. Často jsem přistihl spolupracovníky, jak se náhodně probírají zastaralými a nepřesnými referenčními stránkami o výrazu (které v současné době poskytování nových řešení pro tuto oblast) při pokusech o sestavení plánu datového potrubí. Moje odborné znalosti byly často odsunuty do role dozorce a mé dovednosti byly zneužívány k nepodstatným úkolům, jako je klasifikace typů vousů a barvy vlasů. Když jsem upozornil na trendy v nekonzistenci dat nebo předvídal problémy s hardwarem, byl jsem posazen a nabídnuta mi lekce "jak funguje strojové učení".

V mnoha pracovních nabídkách se objevuje požadavek na X let praxe v oblasti sledování obličeje, ale požadavek na související praxi nestačí. Stejně jako inženýra, který v minulosti pracoval v oblasti lékařské techniky, neopravňuje k tomu, aby se stal lékařem, pouhá práce na technologii sledování obličeje neopravňuje inženýra k tomu, aby se stal odborníkem na výrazy obličeje nebo emoce. Pokud by se kladl větší důraz na najímání vhodných odborníků, možná by se zmírnil boj o inženýry se vzácnými a specifickými zkušenostmi; takové zmírnění by mohlo vytvořit prostor pro inovativnější spolupráci mezi inženýrstvím a doplňkovými obory, s nimiž může být spojeno.

Tunelové vidění velkých technologických firem zaměřené na inženýrství je nedbalý zvyk, který je třeba změnit. Ačkoli jsou softwaroví inženýři pro proces strojového učení skutečně nezbytní, ambice strojového učení nás přivedly do bodu, kdy musíme uznat potřebu mezioborové činnosti. Data pro systémy podmíněná nuancemi by neměla být brána na lehkou váhu - zejména pokud krvácejí potenciálem pro invazivní případy použití. Pokud by si společnosti cenily odbornosti v oblasti datových předmětů se stejnou úctou a podporou, jakou mají v případě inženýrských odborných znalostí, algoritmy údaje, z nichž jsou sestaveny, by byly komplexnější a méně chybné. Nedostatek ucelených datových systémů způsobí, že budeme mít neregulované produkty náchylné ke zkreslení. Nerovnováha investic vychýlená směrem k algoritmům a odkloněná od kvality dat povede k promarněnému inženýrskému úsilí, nedostatečným produktům a šíření neetických technologií.

Neházejte všechny počty zaměstnanců do jednoho košíku. Najímejte zodpovědně.

1 komentář u „Big Tech’s Homogeneous Hiring Habits Are Harming Our Data“

Napsat komentář

Tento web používá Akismet k omezení spamu. Zjistěte, jak jsou zpracovávána data vašich komentářů.

Navrženo pro studia a týmy

Pojďme si promluvit.

facetheFACS@melindaozel.com