Погрешности в отслеживании лиц и эмоций
Мы, кажется, согласны с популярным упрощением, что машины менее предвзяты, чем люди; однако, если вы знакомы с тем, как машины обучаются читать и фокусироваться на различных аспектах данных, вы знаете: Все не так просто.
Машины не свободны от предвзятости, если их обучают люди.
Ниже представлены различные типы смещений, которые могут возникать при отслеживании лиц и маркировке выражений. Многие из этих ошибок можно уменьшить, поэтому я также включил предложения по улучшению методов. Если вы работаете над отслеживанием лиц и эмоций любого типа, это ваша ответственность, чтобы быть в курсе этих предрассудков.
Просмотрите слайды ниже или видео по этой ссылке: Видео YouTube
Текст: Отслеживание многих лиц и эмоций компании попробуйте использовать слова Пола Экмана Система кодирования лица (FACS)
- но многие не тратят время на то, чтобы использовать его правильно.
Текст: Что происходит, когда вы неправильно используете FACS?
- неправильная классификация выражений
- классификация непоследовательных выражений
- предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- анархия
Даже если вы правильно используете FACS, всегда будет существовать предвзятость и несоответствие - но если принять тщательные меры, эти проблемы можно значительно уменьшить.
Текст: неправильная классификация выражений
- Действия лица тонкие и трудно различимые без интенсивного изучения.
- Большинство справочников по FACS (за исключением оригинальное Руководство по FACS) предоставляют неверные визуальные данные FACS - даже источники, считающиеся достоверными.
- Несмотря на эти неточности, такие источники часто используются в качестве ссылок инженерами и исследователями в области слежения за лицом.
- Поскольку технологические компании недостаточно инвестируют в роли, основанные на данных, они, скорее всего, не располагают необходимым персоналом или ресурсами для различения важных действий по лицу.
Текст: неправильная классификация выражений
- Основные формы, такие как "затягиватель губ" регулярно путают с действиями типа "пресс для губ" и/или "губы морщиться.”
- Подтягиватель для губ имеет большое значение: выражения эмоций & производство речи
Текст: неправильная классификация выражений
- Выше показано истинное представление подтяжки для губ.
- Это лишь одна из многих форм, которые каждый раз пролетают под радаром:
– ошибочное обучение – неверная классификация – неправильное использование
Текст: Что происходит, когда вы неправильно используете FACS?
- неправильная классификация выражений
- классификация непоследовательных выражений
- предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- анархия
Даже если вы правильно используете FACS, всегда будет существовать предвзятость и несоответствие - но если принять тщательные меры, эти проблемы можно значительно уменьшить.
Текст: неправильная классификация выражений
Те же проблемы, связанные с неправильной классификацией также способствуют непоследовательной классификации.
Текст: классификация непоследовательных выражений
Если технологические компании не будут тщательно инвестировать в качество данных, их правила классификации данных не могут быть стандартизированы.
В связи с:
- отсутствие инвестиций в наем и/или обучение сотрудников для работы с данными
- отсутствие качественных ресурсов FACS
- внутренняя трудность в дифференциации действий лица
→ Маркировщики классифицируют выражения непоследовательно.
→ У следопытов появляются странные причуды, они связывают неправильные выражения друг с другом и путают других.
Текст: классификация непоследовательных выражений
ПРИМЕЧАНИЕ: Эта диаграмма была составлена для объяснения проблем активации формы для аватаров, но те же основные понятия применимы к отслеживанию лица и эмоций.
Текст: Что происходит, когда вы неправильно используете FACS?
- неправильная классификация выражений
- классификация непоследовательных выражений
- предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- анархия
Даже если вы правильно используете FACS, всегда будет существовать предвзятость и несоответствие - но если принять тщательные меры, эти проблемы можно значительно уменьшить.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Когда метки выражения плохо определены и плохо понятны, небольшие ошибки могут привести к большим предубеждениям.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Прежде чем перейти к рассмотрению предвзятости, которая может существовать в технологии отслеживания лиц, рассмотрим уже существующую предвзятость в технологии идентификации признаков: распознавания лиц.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Если мы даже не можем правильно определить черты лица, представьте, насколько сложным может быть отслеживание выражения лица. Отслеживание выражения требует понимания не только черт лица. Оно требует понимания тонких движений лица.
-
Блейс, Каролин и Джек, Рэйчел и Шиперс, Кристоф и Фисет, Даниэль и Кальдара, Роберто. Culture Shapes How We Look at Faces. (2008).PloS one. 3. e3022. 10.1371/journal.pone.0003022.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- Люди по-разному извлекают информацию, глядя на лица, и ищут разные подсказки при интерпретации эмоций.
- Культура оказывает глубокое влияние на то, что мы считаем ценной информацией и подсказками.
Исследования показали:
- Восточная Азия участники склонны фокусироваться на середине лица, вокруг носа, придавая большее значение глазам и направлению взгляда.
- Западный европеец участники склонны искать выражение эмоций в бровях и области рта
- Эти различия во внимании создают предубеждения, когда участники смотрят на лица с противоречивыми выражениями.
Например, когда у счастливого рта грустные глаза:
- Японские участники придают большее значение эмоциям, отображаемым в глазах
- Американские участники больше заботятся об области рта.
1. Бле, К., Джек, Р. Е., Шиперс, К., Фисет, Д., и Калдара, Р. (2008). Культура формирует то, как мы смотрим на лица. PLoS ONE 3:e3022. doi: 10.1371/journal.pone.0003022.
2. Elfenbein, H. A., & Ambady, N. (2003). Универсалии и культурные различия в распознавании эмоций. Current Directions in Psychological Science, 12(5), 159-164.
3. Matsumoto, D., Kasri, F., & Kooken, K. (1999). Американо-японские культурные различия в суждениях об интенсивности выражения и субъективном опыте. Cognition & Emotion, 13(2), 201-218.
4. Мацумото, Д., и Экман, П. (1989). Американо-японские культурные различия в оценках интенсивности лицевых выражений эмоций. Motivation and Emotion, 13(2), 143-157.
5. Marsh, A. A., Elfenbein, H. A., & Ambady, N. (2003). Невербальные "акценты" культурных различий в лицевых выражениях эмоций. Психологическая наука, 14(4), 373-376.
6. Юки, М., Мэддукс, У. У., и Масуда, Т. (2007). Одинаковы ли окна в душу на Востоке и Западе? Культурные различия в использовании глаз и рта в качестве подсказок для распознавания эмоций в Японии и США. Журнал экспериментальной социальной психологии, 43(2), 303-311.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Теперь рассмотрим, что входит в маркировку выражения...
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- Если депрессор угла губы не понимается правильно, маркировщики с большей вероятностью неправильно классифицируют любой форма с опущенными уголками губ, как депрессор угла губы. Эти неправильно классифицированные формы часто вызваны эффектами райзер для подбородка – но они могут включать в себя и кое-что похуже: нейтральные лица (лица без выражения).
- Одним из вероятных результатов этого заблуждения является: чрезмерное обнаружение депрессор угла губы у людей с опущенными уголками губ. Часто у пожилых людей уголки рта опускаются из-за длительного воздействия гравитации.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- В результате неправильной практики маркировки пожилые люди могут быть подвержены чрезмерному выявлению депрессор угла губы.
- Депрессор для уголков губ - ключевой компонент грусти. Может ли эта ошибка привести к чрезмерному выявлению печали у пожилых людей?
- А как насчет других групп, для черт лица которых характерны опущенные уголки губ? Будут ли они неверно истолкованы как "грустные"?
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- Может показаться, что нет ничего страшного в том, что трекер неправильно определяет депрессор угла губы или печально: Что произойдет, если отслеживание лица будет использоваться для более серьезных вещей, таких как оценка психического здоровья или оценка потенциальных кандидатов на работу?
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- ИИ теперь анализирует выражение лица кандидатов во время видеособеседований - Unilever, IBM, Dunkin Donuts и многие другие уже используют эту технологию
- Технология распознавания эмоций не работает, но специалисты по найму и другие люди все равно ее используют: доклад
- ИИ "распознавания эмоций" - это индустрия с оборотом в $20 миллиардов. Новые исследования показывают, что он не может делать то, что заявляет.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Мы говорили о том, как неправильная маркировка может провоцировать предвзятое отношение к пожилым людям. . . Но как насчет других предубеждений в отношении людей с определенными чертами лица?
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
". ... программы распознавания лиц демонстрируют два различных типа предвзятости.
Первый, черные лица постоянно оценивались как более злые, чем белые, при любой улыбке. Face++ продемонстрировал этот тип предвзятости. Второй, черные лица всегда считались более злыми если существовала какая-либо двусмысленность в выражении их лица. API лица продемонстрировал этот тип неравенства. Даже если черные лица частично улыбаются, мой анализ показал, что системы предполагали больше негативных эмоций по сравнению с их белыми коллегами с аналогичным выражением лица. Средние эмоциональные оценки были намного ближе между расами, но все же были заметные различия для черных и белых лиц".
Понимание скрытой предвзятости в ИИ, считывающем эмоции
-Лорен Рю
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Как может ли это произойти?
Давайте вспомним, ПОЧЕМУ ВАЖНО ВЛОЖИТЬ БОЛЬШЕ В ДАННЫЕ.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Рассмотрим форму FACS "райзер верхней губы.” верхняя губа дождевателя является ключевым компонентом таких эмоций, как отвращение, гнев, и пренебрежение.
Особенности устройства для поднятия верхней губы включают:
- приподнятая верхняя губа
- закругленная область верхней носогубной борозды
(смех - см. фото)
ПРИМЕЧАНИЕ: Помимо потенциальных предубеждений в отношении маркировки лицевых действий, существуют также значительные разногласия по поводу теории базовых эмоций (например, базовых прототипов эмоций, таких как презрение, гнев и т.д.) в целом. См. "'Все дело в глазах" и другая ложь.“
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
У некоторых людей носогубная борозда более кривая.
Это просто результат их естественного строения лица.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Человек, не владеющий системой кодирования лицевых действий, может легко ошибочно определить людей с невыразительными изгибами носогубной борозды как имеющих райзер верхней губы.
Эти неправильные метки рождают следящее устройство, обученное идентифицировать лица с определенными структурами, как выражающие райзер верхней губы - даже когда они нейтральны или улыбаются.
Получение "разнообразного набора данных" не имеет значения, если ваши метки неточны.
Такое обучение объясняет выводы Лорен Рю из Понимание скрытой предвзятости в ИИ, считывающем эмоции.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Присутствие предвзятого маркирования эмоций сохранится, даже если вы отойдете от подхода, основанного на FACS, и попытаетесь заставить маркировщиков классифицировать эмоции целостно.
Текст: предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
Если вам не ясно, почему целостное маркирование эмоций имеет такую же вероятность провала (если не большую), то... ВОТ КРАТКАЯ ИНФОРМАЦИЯ:
- Люди по-разному извлекают информацию, глядя на лица, и ищут разные подсказки при интерпретации эмоций.
- Культура оказывает глубокое влияние на то, что мы считаем ценной информацией и подсказками.
Исследования показали:
- Восточная Азия участники, как правило, фокусируются на середине лица, вокруг носа, придавая большее значение глазам и направлению взгляда.
- Западный европеец участники склонны искать выражение эмоций в бровях и области рта
- Эти различия во внимании создают предубеждения, когда участники смотрят на лица с противоречивыми выражениями.
Например, когда у счастливого рта грустные глаза:
- Японские участники придают большее значение эмоциям, отображаемым в глазах
- Американские участники больше заботятся об области рта.
Текст: Что происходит, когда вы неправильно используете FACS?
- неправильная классификация выражений
- классификация непоследовательных выражений
- предвзятое навешивание ярлыков (расовых, культурных, возрастных и т.д.)
- анархия
Даже если вы правильно используете FACS, всегда будет существовать предвзятость и несоответствие - но если принять тщательные меры, эти проблемы можно значительно уменьшить.
Текст: анархия
Если ....
- культура влияет на то, как мы интерпретируем выражения и эмоции
- условия окружающей среды влияют на то, на какие признаки мы обращаем внимание, чтобы оценить лицо
- знание действий лица влияет на то, как мы обозначаем выражения
. . . Что могут сделать технологические компании, чтобы уменьшить количество этих человеческих ошибок и предотвратить их утечку в алгоритмы?
Текст: Что могут сделать технологические компании, чтобы уменьшить предвзятость при отслеживании лиц?
- Технологические компании должны признать, что отслеживание лиц вышло за рамки инженерных разработок.
- Технологические компании должны признавать уязвимость технологий к предвзятости и обучать сотрудников этой уязвимости.
- Технологические компании должны больше инвестировать в качество данных.
Текст: Признание достижений технологии отслеживания лиц, понимание ее уязвимости и увеличение инвестиций в качество данных означает... . .
- На самом деле распределение численности персонала в сторону должностей, ориентированных на качество данных - даже если это потребует выделения места из штата инженеров.
- Тратить время, энергию, и ресурсы на найти специалистов по работе с данными. Если это невозможно, компания все равно должна потратить время, энергию и ресурсы на обучение специалистов по работе с данными. Классификация выражений лица намного сложнее, чем классификация таких базовых объектов, как светофор, и к ней следует подходить соответствующим образом.
Текст: Уменьшение смещений при отслеживании лиц
Признание достижений технологии отслеживания лиц, понимание ее уязвимости и увеличение инвестиций в качество данных означает... . .
- Инженерные разработки, исследования и продукты должны не просто сообщать данным, что им нужно, но и СЛУШАТЬ их. на то, что нужно командам по работе с данными. Команды по работе с данными лучше всех разбираются в закулисной работе, необходимой для функционирования алгоритмов. ИМЕННО ЗДЕСЬ МНОГИЕ КОМПАНИИ ТЕРПЯТ НЕУДАЧУ.
- Требование к сотрудникам, выполняющим функции, связанные с данными, регулярно взаимодействовать с инженерными, исследовательскими и продуктовыми командами.
Текст: Уменьшение смещений при отслеживании лиц
Признание достижений технологии отслеживания лиц, понимание ее уязвимости и увеличение инвестиций в качество данных означает... . .
- Обучение сотрудников реальности предвзятости в технологиях.
- Принятие правильных мер предосторожности для стандартизация и определение маркировки.
- Всегда рассмотрение того, когда и где может проявиться предвзятость.
- Кто навешивает ярлыки?
- Что они обозначают?
- Какие факторы могут повлиять на их маркировку?
* настроение * культура * опыт
Текст: Уменьшение смещений при отслеживании лиц
Признание достижений технологии отслеживания лиц, понимание ее уязвимости и увеличение инвестиций в качество данных означает... . .
SIDENOTE: ПРЕКРАЩЕНИЕ МАРКИРОВКИ ВЫРАЖЕНИЙ СО СТАТИЧНЫХ ИЗОБРАЖЕНИЙ.
- Точная маркировка FACS и эмоций в значительной степени зависит от способности видеть движение.
- Если бы движение подчеркивалось сильнее, статичные черты лица, такие как опущенные уголки губ и изогнутая носогубная борозда, с меньшей вероятностью активировали бы обнаружение депрессор угла губы и райзер верхней губы (соответственно).
Текст: Уменьшение смещений при отслеживании лиц
Заключительные замечания . . .
Текст: Уменьшение смещений при отслеживании лиц
Чем больше мы верим в технологии и полагаемся на них, тем больше последствий будут иметь эти предубеждения.
Текст: Уменьшение смещений при отслеживании лиц
"... программное обеспечение для распознавания лиц по-разному интерпретирует эмоции в зависимости от расовой принадлежности человека. ...Этот вывод имеет последствия для отдельных людей, организаций и общества, и он вносит вклад в растущую литературу о предвзятости и/или неравном воздействии в ИИ".
Рю, Лорен, Расовое влияние на автоматическое восприятие эмоций (9 ноября 2018 года). Доступно в SSRN: https://ssrn.com/abstract=3281765 или http://dx.doi.org/10.2139/ssrn.3281765
Текст: Уменьшение смещений при отслеживании лиц
Возьмите на себя ответственность.
Приложите усилия, чтобы уменьшить предвзятость.
Больше инвестируйте в данные.
Текст:
В ответ на распространенность некачественных и неточных ссылок на FACS, Я создал бесплатную "Шпаргалку по FACS". чтобы служить руководством для художников, исследователей и инженеров. Он доступен на моем сайте ресурсов FACS, Лицом к лицу с ВВС. Я также открыт для консультаций.
1 комментарий к “Bias In Emotion Tracking”
Обсуждение закрыто.