В нашем цифровом мире, ориентированном на потребителя, возникла острая необходимость в инновациях и разработке новых продуктов. В связи с тем, что машинное обучение является трендом, а также в связи с постоянным стремлением быстро двигаться и ломать - я имею в виду "строить" - вещи, компания Big Tech постоянно нуждается в строителях. В результате инженеры-программисты стали весьма желанным товаром, доминирующим в штате и провоцирующим тендерные войны между компаниями. Однако по мере роста амбиций машинного обучения растут и потребности в данных, в результате чего проблемы, ориентированные на инженеров, превращаются в междисциплинарные. Проекты, дающие весьма неоднозначные данные - например, мимика лица для отслеживания лиц - требуют понимания данных, выходящего за рамки инженерной деятельности; они требуют междисциплинарного брака между инженерией и дополнительной областью, которая применяется. Поэтому для технологических компаний очень важно взять на себя ответственность за целостность данных, привлекая к процессу разработки продукта специалистов в этой области.
В то время как в культуре Big Tech не принято отдавать предпочтение неинженерным ролям, в других отраслях промышленности признается важность актуальных знаний и опыта в области машинного обучения. Биотехнологическая область, например, опирается на сотрудничество между обоими медицинскими экспертами. и инженеры. В этом случае необходимость сотрудничества очевидна, но в более непонятных сферах специализации потребность в нем не всегда очевидна. Как упоминалось ранее, одной из основных областей, страдающих от неясности и отсутствия понимания, является отслеживание лиц. Обычные случаи использования отслеживания лица - включая фильтры для лица, обнаружение признаков для рекламы продукции (например, обнаружение губ для тестирования помады или глаз для очков) и аватары - относительно безопасны. Однако при рассмотрении менее "милых" случаев использования, таких как определение эмоций, мониторинг поведения и обнаружение обмана, которые находят применение в системе уголовного правосудия, страховом секторе или кибербезопасности, работа модели машинного обучения становится спорной, а при неправильном подходе - опасной. Уже известно множество проблем, связанных с технологией распознавания лиц и ее нерегулируемым использованием в различных странах и отраслях. Поскольку отслеживание выражения лица не просто идентифицирует человека, а скорее наблюдает и делает выводы о его поведении, оно может быть гораздо более инвазивным.
Несмотря на фундаментальную важность данных о выражении лица для отслеживания лиц, компания Big Tech часто не уделяет приоритетного внимания качеству данных о выражении лица. Менеджеры по продукции, руководители инженерных служб, исследователи пользователей и инженеры-программисты обычно полагаются на собственное поверхностное понимание и специальные поиски, вместо того чтобы воспользоваться глубиной понимания, которую может дать эксперт. Хотя инженеры-программисты являются мастерами в создании алгоритмов, они часто обладают лишь поверхностными знаниями о том, что входит в состав данных. Учитывая высокую рабочую нагрузку и сосредоточенность на собственных специальных знаниях, инженерам не представляется возможным развить дополнительный опыт в тщательном изучении тонких данных о выражении лица или освоить сложные концепции в исследовании эмоций.
Определение того, какой тип данных необходим, как их собирать и как маркировать, является следующим деликатный процесс. Если вы решите нацелиться на неверные данные, не будет иметь значения, насколько хорошо вы их собираете или маркируете. Если вы нацеливаетесь на полезные данные, но собираете их неправильно, то это тоже будет неудачей. Если вы не пометите их точно и/или неточно, это опять не удастся. Из-за морфологических различий в чертах лица, неизбежных предубеждений в интерпретации выражений и противоречий как между исследователями эмоций, так и между специалистами по анатомии лица, любая группа, разрабатывающая алгоритмы отслеживания лиц с намерениями, выходящими за рамки попыток, прежде чем купить помаду, должна принять на себя ответственность и этическую ответственность за целостность данных.
Вместо того чтобы гарантировать, что составные части их алгоритмов хорошо понятны тем, кто их использует, прискорбное состояние Больших Технологий заключается в сборе или приобретении массовых объемов данных и передаче их сторонним маркировщикам. Эти маркировщики, как правило, работают на аутсорсинге, по контракту и почти всегда недооцениваются. Для контроля качества этикеток стандартом является создание и применение различных ключевых показателей эффективности, или KPI, но поскольку Big Tech предпочитает не вкладывать ресурсы в людей, которые могут законно контролировать качество передовых данных, KPI обычно произвольны и малоэффективны. Еще одна проблема заключается в том, что если инженеры не обладают достаточной глубиной понимания для определения истины, то что же они на самом деле измеряют? Существует несамостоятельное обучение. А есть неконтролируемая инженерия.
Когда я работал в одной из компаний "большой пятерки" в Кремниевой долине, меня постоянно шокировало беспечное отношение к сложным данным отслеживания лиц. Хотя мои коллеги были ведущими специалистами в области разработки алгоритмов, они обладали поверхностным пониманием анатомии лица, основных понятий эмоций и поведения при выражении лица. Как и любой другой высокоспециализированный предмет, понимание нюансов человеческой экспрессии требует многих лет интенсивного изучения и опыта. Несмотря на то, что я был штатным экспертом по мимике, посвятившим свою жизнь и карьеру пониманию нюансов человеческого лица, меня регулярно исключали из важных совещаний и заседаний по планированию. Я часто заставал коллег, бессистемно листающих устаревшие и неточные справочники по выражению лица (которые я в настоящее время предоставление новых решений здесь) в попытках составить план конвейера данных. Мой опыт часто сводился к роли супервайзера, а мои навыки использовались не по назначению, например, для классификации типов бороды и цвета волос. Когда я замечал тенденции несоответствия данных или предвидел проблемы с оборудованием, меня усаживали за стол и предлагали пройти урок "как работает машинное обучение".
Я вижу много вакансий, в которых запрашивается X-летний опыт работы в области отслеживания лиц, но запроса соответствующего опыта недостаточно. Точно так же, как прошлая работа инженера в области медицинских технологий не позволяет ему быть практикующим врачом, просто работая над технологией слежения, он не позволяет ему быть авторитетом в области мимики и эмоций. Если бы больше внимания уделялось найму соответствующих экспертов, возможно, борьба за поиск инженеров с редким и специфическим опытом была бы облегчена; такое облегчение могло бы создать условия для более инновационного сотрудничества между инженерами и дополнительными дисциплинами, с которыми они могут быть объединены.
Туннельный взгляд Большого технологического института на инженерию - это небрежная привычка, которую необходимо изменить. Хотя инженеры-программисты действительно важны для процесса машинного обучения, амбиции машинного обучения привели нас к тому, что мы должны признать необходимость междисциплинарных действий. К данным для систем, зависящих от нюансов, не следует относиться легкомысленно - особенно когда они несут в себе потенциал для инвазивных сценариев использования. Если бы компании ценили экспертизу в области данных с таким же почтением и поддержкой, как и инженерную экспертизу, алгоритмы и данные, на основе которых они создаются, были бы более полными и менее ошибочными. Отсутствие целостных систем данных оставит нас с нерегулируемыми продуктами, подверженными предвзятости. Дисбаланс инвестиций в сторону алгоритмов и в сторону качества данных приведет к напрасной трате инженерных усилий, некачественным продуктам и распространению неэтичных технологий.
Не клади все свои головные уборы в одну корзину. Нанять ответственно.
1 комментарий к “Big Tech’s Homogeneous Hiring Habits Are Harming Our Data”