In unserer verbraucherorientierten digitalen Welt haben wir eine Dringlichkeit hergestellt, innovativ zu sein und neue Produkte zu entwickeln. Mit dem Trend zum maschinellen Lernen und dem sich selbst verstärkenden Druck, schnell zu sein und Dinge zu verändern - ich meine zu "bauen" -, braucht Big Tech ständig Entwickler. Infolgedessen sind Software-Ingenieure zu einer sehr begehrten Ware geworden, die den Personalbestand dominiert und zu Bieterkriegen zwischen Unternehmen führt. Mit den wachsenden Ambitionen im Bereich des maschinellen Lernens wächst jedoch auch der Bedarf an Daten, wodurch ingenieurzentrierte Probleme zu disziplinübergreifenden Angelegenheiten werden. Projekte, die hochgradig mehrdeutige Daten liefern - wie z. B. Gesichtsausdrücke für die Gesichtsverfolgung - erfordern ein Verständnis der Daten, das über den Rahmen der Ingenieurwissenschaften hinausgeht; sie erfordern eine disziplinübergreifende Verbindung zwischen Ingenieurwissenschaften und dem komplementären Bereich, der angewendet wird. Daher ist es für Technologieunternehmen entscheidend, die Verantwortung für die Datenintegrität zu übernehmen, indem sie Fachexperten in den Produktentwicklungsprozess einbeziehen.
Während es nicht zur Kultur der Big Tech gehört, nicht-technische Rollen zu priorisieren, erkennen andere Industriezweige die Bedeutung von aktuellem Fachwissen im Bereich des maschinellen Lernens an. Der Biotech-Bereich zum Beispiel ist auf die Zusammenarbeit zwischen beiden medizinischen Experten angewiesen. und Ingenieure. In diesem Fall ist die Notwendigkeit der Zusammenarbeit offensichtlich, aber in eher undurchsichtigen Bereichen der Spezialisierung ist die Notwendigkeit nicht immer offensichtlich. Wie bereits erwähnt, ist ein wichtiger Bereich, der unter Unklarheit und mangelndem Verständnis leidet, die Gesichtsverfolgung. Gängige Anwendungsfälle für die Gesichtsverfolgung - darunter Gesichtsfilter, Merkmalserkennung für Produktwerbung (z. B. Lippenerkennung zum Testen von Lippenstiftprodukten oder Augenerkennung für Brillen) und Avatare - sind relativ harmlos. Wenn man jedoch weniger "niedliche" Anwendungsfälle wie Emotionserkennung, Verhaltensüberwachung und Täuschungserkennung mit Anwendungen in der Strafjustiz, im Versicherungssektor oder in der Welt der Cybersicherheit in Betracht zieht, wird die Leistung eines maschinellen Lernmodells umstritten; und wenn es falsch gemacht wird, wird es gefährlich. Es gibt bereits viele bekannte Probleme mit der Gesichtserkennungstechnologie und ihrem unregulierten Einsatz in verschiedenen Ländern und Branchen. Da die Verfolgung des Gesichtsausdrucks eine Person nicht einfach nur identifiziert, sondern beobachtet und Rückschlüsse auf das Verhalten dieser Person zieht, kann sie weitaus invasiver sein.
Trotz der grundlegenden Bedeutung von Mimikdaten für die Gesichtsverfolgung versäumt es Big Tech oft, der Qualität von Mimikdaten Priorität einzuräumen. Produktmanager, technische Leiter, Benutzerforscher und Softwareingenieure verlassen sich häufig auf ihr eigenes oberflächliches Verständnis und Ad-hoc-Suchen, anstatt von der Tiefe des Verständnisses zu profitieren, das ein Experte bieten könnte. Software-Ingenieure sind zwar Meister im Erstellen von Algorithmen, haben aber oft nur ein oberflächliches Wissen darüber, was in den Daten steckt. In Anbetracht der hohen Arbeitsbelastung und der Konzentration auf das eigene Fachwissen ist es für Ingenieure nicht möglich, eine zusätzliche Expertise in der Untersuchung von subtilen Ausdrucksdaten oder der Beherrschung komplexer Konzepte in der Emotionsforschung zu entwickeln.
Zu bestimmen, welche Art von Daten benötigt werden, wie sie zu sammeln sind und wie sie zu kennzeichnen sind, ist eine delikater Prozess. Wenn Sie sich für die falschen Daten entscheiden, spielt es keine Rolle, wie gut Sie sie sammeln oder beschriften. Wenn Sie nützliche Daten ins Visier nehmen, diese aber unsachgemäß sammeln, werden sie auch scheitern. Es wird erneut fehlschlagen, wenn Sie die Daten nicht präzise und/oder genau kennzeichnen. Aufgrund morphologischer Unterschiede in den Gesichtszügen, inhärenter Verzerrungen bei der Interpretation des Gesichtsausdrucks und Kontroversen sowohl unter Emotionsforschern als auch unter Gesichtsanatomen muss jede Gruppe, die Gesichtsverfolgungsalgorithmen mit Absichten entwickelt, die über das Versuchen-vor-dem-Kaufen von Lippenstift hinausgehen, Verantwortung und ethische Verantwortung für die Datenintegrität übernehmen.
Anstatt sicherzustellen, dass die Bausteine ihrer Algorithmen von denjenigen, die sie verwenden, gut verstanden werden, besteht der unglückliche Zustand von Big Tech darin, massenhaft Daten zu sammeln oder zu erwerben und sie an Drittanbieter von Etiketten weiterzugeben. Die Labeler sind typischerweise ausgelagert, auf Vertragsbasis, und fast immer unterbewertet. Um die Qualität der Labels zu überwachen, werden standardmäßig verschiedene Key Performance Indicators (KPIs) erstellt und durchgesetzt. Da Big Tech jedoch keine Ressourcen in Mitarbeiter investiert, die die Qualität der erweiterten Daten legitim überwachen können, sind die KPIs im Allgemeinen willkürlich und wenig aussagekräftig. Wenn die Ingenieure nicht über das nötige Verständnis verfügen, um grundlegende Wahrheiten zu erkennen, was messen sie dann eigentlich? Es gibt das unüberwachte Lernen. Und dann gibt es unüberwachtes Engineering.
Als ich für eine der Big Five-Firmen im Silicon Valley arbeitete, war ich immer wieder schockiert über die nonchalante Haltung gegenüber komplexen Gesichtsverfolgungsdaten. Obwohl meine Kollegen führende Köpfe in der Algorithmenentwicklung waren, besaßen sie ein oberflächliches Verständnis der Gesichtsanatomie, der zentralen Emotionskonzepte und des Ausdrucksverhaltens. Wie jedes andere hochspezialisierte Fachgebiet erfordert das Verständnis der Nuancen des menschlichen Ausdrucks jahrelanges, intensives Studium und Erfahrung. Trotz der Tatsache, dass ich der ansässige Experte für Mimik war, der sein Leben und seine Karriere dem Verständnis der Nuancen des menschlichen Gesichts gewidmet hatte, wurde ich regelmäßig von wichtigen Meetings und Planungssitzungen ausgeschlossen. Oft ertappte ich Mitarbeiter dabei, wie sie planlos veraltete und ungenaue Mimik-Referenzseiten durchforsteten (die ich derzeit Bereitstellung neuer Lösungen für hier) in Versuchen, einen Daten-Pipeline-Plan zusammenzuhacken. Mein Fachwissen wurde häufig in eine Aufsichtsrolle verbannt, und meine Fähigkeiten wurden für irrelevante Aufgaben wie die Klassifizierung von Barttypen und Haarfarben missbraucht. Wenn ich Trends in Dateninkonsistenzen aufzeigte oder Hardwareprobleme voraussah, wurde ich hingesetzt und mir wurde eine Lektion darüber erteilt, "wie maschinelles Lernen funktioniert".
Ich sehe viele Stellenangebote, in denen X Jahre Erfahrung in der Gesichtsverfolgung gefordert wird, aber die Forderung nach entsprechender Erfahrung reicht nicht aus. Genauso wenig wie die bisherige Arbeit eines Ingenieurs in der Medizintechnik ihn als Mediziner qualifiziert, qualifiziert die bloße Arbeit an der Tracking-Technologie einen Ingenieur als Autorität für Gesichtsausdrücke oder Emotionen. Wenn man sich mehr darauf konzentrieren würde, die geeigneten Experten einzustellen, würde vielleicht das Ringen um Ingenieure mit seltener und spezifischer Erfahrung erleichtert; eine solche Erleichterung könnte Raum schaffen für eine innovativere Zusammenarbeit zwischen dem Ingenieurwesen und den komplementären Disziplinen, mit denen es gepaart werden kann.
Der Tunnelblick von Big Tech auf das Engineering ist eine fahrlässige Gewohnheit, die sich ändern muss. Während Software-Ingenieure in der Tat essentiell für den Prozess des maschinellen Lernens sind, haben uns die Ambitionen des maschinellen Lernens an einen Punkt gebracht, an dem wir die Notwendigkeit eines disziplinübergreifenden Vorgehens erkennen müssen. Daten für Systeme, die von Nuancen abhängig sind, sollten nicht auf die leichte Schulter genommen werden - vor allem, wenn sie Potenzial für invasive Anwendungsfälle bergen. Würden Unternehmen das Fachwissen über Daten mit der gleichen Ehrfurcht und Unterstützung bewerten, wie sie es mit dem Fachwissen der Ingenieure tun, würden die Algorithmen und die Daten, aus denen sie aufgebaut sind, umfassender und weniger fehleranfällig wären. Ein Mangel an ganzheitlichen Datensystemen wird dazu führen, dass wir ungeregelte Produkte haben, die anfällig für Verzerrungen sind. Ein Ungleichgewicht der Investitionen in Richtung Algorithmen und weg von der Datenqualität wird zu verschwendetem technischen Aufwand, mangelhaften Produkten und der Verbreitung unethischer Technologie führen.
Legen Sie nicht alle Ihre Mitarbeiterzahlen in einen Korb. Stellen Sie verantwortungsbewusst ein.
1 Gedanke zu „Big Tech’s Homogeneous Hiring Habits Are Harming Our Data“