Błędy w śledzeniu twarzy i emocji
Wydaje się, że podpisujemy się pod popularnym uproszczeniem, że maszyny są mniej stronnicze niż ludzie; jednakże, jeśli jesteś zaznajomiony ze sposobami, w jakie maszyny są szkolone do czytania i skupiania się na różnych aspektach danych, będziesz wiedział: To po prostu nie jest takie proste.
Maszyny nie są wolne od uprzedzeń, jeśli są szkolone przez ludzi.
Poniżej przedstawiam różne rodzaje błędów, które mogą wystąpić w śledzeniu twarzy i etykietowaniu wyrazów. Wiele z tych błędów można zredukować, dlatego zamieściłem również sugestie dotyczące usprawnienia metod. Jeśli pracujesz nad śledzeniem twarzy i emocji dowolnego typu, Twoim obowiązkiem jest być świadomym tych uprzedzeń.
Zobacz slajdy poniżej LUB wideo połączone tutaj: YouTube Video
Tekst: Wiele twarzy i śledzenie emocji firmy spróbuj by użyć Paula Ekmana System kodowania działań na twarzy (FACS)
- ale wielu nie poświęca czasu, by używać go właściwie.
Tekst: Co się dzieje, gdy nie używasz FACS właściwie?
- nieprawidłowa klasyfikacja wyrażeń
- niespójna klasyfikacja wyrazów
- tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- anarchia
Nawet przy prawidłowym stosowaniu FACS zawsze będzie występować stronniczość i niespójność - ale podejmując staranne działania, można te problemy znacznie ograniczyć.
Tekst: nieprawidłowa klasyfikacja wyrażeń
- Działania na twarzy są subtelne i trudne do rozróżnienia bez intensywnych studiów.
- Większość referencji dotyczących FACS (z wyłączeniem oryginalny FACS Manual) dostarczają nieprawidłowych wizualizacji FACS - nawet źródła uznawane za wiarygodne.
- Pomimo tych nieścisłości, takie źródła są często wykorzystywane jako referencje przez inżynierów i badaczy zajmujących się śledzeniem twarzy.
- Ponieważ firmy technologiczne nie inwestują wystarczająco dużo w role oparte na danych, prawdopodobnie nie posiadają odpowiedniego personelu lub zasobów do rozróżniania ważnych działań na twarzy.
Tekst: nieprawidłowa klasyfikacja wyrażeń
- Podstawowe kształty takie jak "zaciskarka do ust" regularnie są mylone z działaniami typu "wytłaczarka do ust" i/lub "warga fujarka.”
- Napinacz do ust jest ważne w: wyrażanie emocji & produkcja mowy
Tekst: nieprawidłowa klasyfikacja wyrażeń
- Powyżej znajduje się prawdziwe odwzorowanie preparatu do zaciskania ust.
- To tylko jeden z wielu kształtów, które za każdym razem przelatują pod radarem:
– nietrafiony wybór – błędnie sklasyfikowany – nadużywany
Tekst: Co się dzieje, gdy nie używasz FACS prawidłowo?
- nieprawidłowa klasyfikacja wyrażeń
- niespójna klasyfikacja wyrazów
- tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- anarchia
Nawet przy prawidłowym stosowaniu FACS zawsze będzie występować stronniczość i niespójność - ale podejmując staranne działania, można te problemy znacznie ograniczyć.
Tekst: nieprawidłowa klasyfikacja wyrażeń
Te same problemy związane z nieprawidłową klasyfikacją również przyczyniają się do niespójności klasyfikacji.
Tekst: niespójna klasyfikacja wyrazów
Jeśli firmy technologiczne nie będą dokładnie inwestować w jakość danych, ich zasady klasyfikacji danych nie mogą być znormalizowane.
Ze względu na:
- brak inwestycji w zatrudnianie i/lub szkolenie pracowników do pełnienia funkcji związanych z danymi
- brak wysokiej jakości zasobów FACS
- nieodłączną trudność w rozróżnianiu działań na twarzach
→ Etykieciarze klasyfikują wyrażenia niekonsekwentnie.
→ Tropiciele rozwijają dziwne dziwactwa, wiążąc ze sobą niepoprawne wyrażenia, jednocześnie myląc innych.
Tekst: niespójna klasyfikacja wyrazów
UWAGA: Ten schemat został wykonany w celu wyjaśnienia problemów z aktywacją kształtu dla awatarów, ale te same podstawowe koncepcje mają zastosowanie do śledzenia twarzy i emocji.
Tekst: Co się dzieje, gdy nie używasz FACS prawidłowo?
- nieprawidłowa klasyfikacja wyrażeń
- niespójna klasyfikacja wyrazów
- tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- anarchia
Nawet przy prawidłowym stosowaniu FACS zawsze będzie występować stronniczość i niespójność - ale podejmując staranne działania, można te problemy znacznie ograniczyć.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Kiedy etykiety wyrazów są źle zdefiniowane i słabo rozumiane, małe błędy mogą powodować duże uprzedzenia.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Zanim przejdziemy do stronniczości, która może istnieć w technologii śledzenia twarzy, rozważmy już istniejące stronniczości w technologii identyfikacji cech: rozpoznawanie twarzy.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Jeśli nie potrafimy nawet poprawnie wykryć cech, wyobraź sobie, jak skomplikowane może być śledzenie ekspresji. Śledzenie ekspresji wymaga zrozumienia nie tylko cech twarzy. Wymaga zrozumienia subtelnych ruchów twarzy.
-
Blais, Caroline & Jack, Rachael & Scheepers, Christoph & Fiset, Daniel & Caldara, Roberto. Culture Shapes How We Look at Faces. (2008).PloS one. 3. e3022. 10.1371/journal.pone.0003022.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- Ludzie inaczej wydobywają informacje patrząc na twarze i szukają różnych wskazówek przy interpretacji emocji.
- Kultura głęboko wpływa na to, co uważamy za wartościowe informacje i wskazówki.
Badania wykazały:
- wschodnioazjatycki uczestnicy mają tendencję do skupiania się na środku twarzy, wokół nosa, przywiązując większą wagę do oczu i kierunku spojrzenia.
- Zachodniokaukaski uczestnicy mają tendencję do szukania wyrazów emocji w brwiach i okolicach ust
- Te różnice w uwadze tworzą błędy, gdy uczestnicy patrzą na twarze o sprzecznych wyrazach.
np. Gdy przy szczęśliwych ustach są smutne oczy:
- Japońscy uczestnicy przywiązują większą wagę do emocji okazywanych w oczach
- Amerykańscy uczestnicy bardziej dbają o okolice ust.
1. Blais, C., Jack, R. E., Scheepers, C., Fiset, D., and Caldara, R. (2008). Culture shapes how we look at faces. PLoS ONE 3:e3022. doi: 10.1371/journal.pone.0003022
2. Elfenbein, H. A., & Ambady, N. (2003). Uniwersalność i różnice kulturowe w rozpoznawaniu emocji. Current Directions in Psychological Science, 12(5), 159-164.
3. Matsumoto, D., Kasri, F., & Kooken, K. (1999). American-Japanese cultural differences in judgements of expression intensity and subjective experience. Cognition & Emotion, 13(2), 201-218.
4. Matsumoto, D., & Ekman, P. (1989). American-Japanese cultural differences in intensity ratings of facial expressions of emotion. Motivation and Emotion, 13(2), 143-157.
5. Marsh, A. A., Elfenbein, H. A., & Ambady, N. (2003). Nonverbal "accents" cultural differences in facial expressions of emotion. Psychological Science, 14(4), 373-376.
6. Yuki, M., Maddux, W. W., & Masuda, T. (2007). Czy okna do duszy są takie same na Wschodzie i Zachodzie? Różnice kulturowe w używaniu oczu i ust jako wskazówek do rozpoznawania emocji w Japonii i Stanach Zjednoczonych. Journal of Experimental Social Psychology, 43(2), 303-311.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Teraz zastanów się, co wchodzi w skład etykiety wyrazowej .
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- Jeśli depresor narożnika wargowego nie jest prawidłowo rozumiana, etykieciarze są bardziej skłonni do błędnej klasyfikacji każdy kształt z opadającymi kącikami ust jako depresor narożnika wargowego. Te błędnie sklasyfikowane kształty są często spowodowane efektami podbródek – ale mogą też zawierać coś gorszego: twarze neutralne (twarze bez wyrazu).
- Jednym z prawdopodobnych skutków tego błędnego rozumowania jest: nadmierne wykrywanie depresor narożnika wargowego u osób z opadającymi kącikami ust. Często osoby starsze mają opadające kąciki ust ze względu na długotrwałe działanie grawitacji.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- Z powodu niewłaściwych praktyk etykietowania, starsze grupy wiekowe mogą być narażone na nadmierne wykrywanie depresor narożnika wargowego.
- Depresor do kącików ust to kluczowy element smutku. Czy błąd ten może prowadzić do nadmiernego wykrywania smutku w starszych grupach demograficznych?
- A co z innymi grupami, których rysy twarzy charakteryzują się opadającymi kącikami ust? Czy zostaną one błędnie zinterpretowane jako "smutne"?
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- Nieprawidłowe wykrywanie przez trackera może nie wydawać się niczym nadzwyczajnym. depresor narożnika wargowego lub Smutek, ale: Co się dzieje, gdy śledzenie twarzy jest wykorzystywane do większych rzeczy, takich jak ocena zdrowia psychicznego lub ocena potencjalnych kandydatów do pracy?
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- AI analizuje teraz ekspresję twarzy kandydatów podczas wideo rozmów kwalifikacyjnych - Unilever, IBM, Dunkin Donuts i wiele innych firm już korzysta z tej technologii
- Technologia rozpoznawania emocji nie działa, ale specjaliści od zatrudniania i inni i tak jej używają: raport
- 'Wykrywanie emocji' AI to przemysł wart $20 miliardów. Nowe badania mówią, że nie potrafi robić tego, co twierdzi.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Rozmawialiśmy o tym, jak niewłaściwe oznakowanie może wywołać uprzedzenia wobec starszych populacji . . . Ale co z innymi uprzedzeniami wobec osób o określonych rysach twarzy?
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
". . programy do rozpoznawania twarzy wykazują dwa odrębne rodzaje stronniczości.
Po pierwsze, czarne twarze były konsekwentnie oceniane jako gniewne niż białe twarze dla każdego uśmiechu. Face++ wykazał się tego typu stronniczością. Drugi, czarne twarze zawsze były oceniane jako gniewne jeśli istniały jakieś niejasności co do ich wyrazu twarzy. Face API wykazywało tego typu rozbieżności. Nawet jeśli czarne twarze są częściowo uśmiechnięte, moja analiza wykazała, że systemy zakładały więcej negatywnych emocji w porównaniu z ich białymi odpowiednikami o podobnej ekspresji. Średnie wyniki emocjonalne były znacznie bliższe u różnych ras, ale nadal istniały zauważalne różnice dla czarnych i białych twarzy."
Zrozumienie ukrytej tendencyjności u SI odczytujących emocje
-Lauren Rhue
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Jak czy to się może zdarzyć?
Przypomnijmy, DLACZEGO WAŻNE JEST, ABY INWESTOWAĆ WIĘCEJ W DANE.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Rozważania na temat kształtu FACS "górna warga raiser.” Podwyższacz górnej wargi jest kluczowym składnikiem emocji jak np. Obrzydzenie, Gniew, oraz pogarda.
Cechy górnego wargacza obejmują:
- podniesiona górna warga
- zaokrąglony górny obszar bruzdy nosowo-wargowej
(linia śmiechu - patrz zdjęcie)
UWAGA: Oprócz potencjalnych błędów etykietowania czynności twarzy, istnieją również znaczne kontrowersje dotyczące teorii Basic Emotion (np. podstawowych prototypów emocji, takich jak pogarda, gniew itp.) w ogóle. Zobacz "It's All In the Eyes" i inne kłamstwa.“
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
U niektórych osób bruzdy nosowo-wargowe są bardziej krzywe.
Jest to po prostu produkt ich naturalnie występującej struktury twarzy.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Osoba etykietująca, która nie jest odpowiednio zaznajomiona z Systemem Kodowania Czynności Twarzy, może z łatwością błędnie oznaczyć osoby z krzywymi bruzdami nosowo-wargowymi nie opartymi na ekspresji jako posiadające górna warga raiser.
Te niepoprawne etykiety rodzą u tropiciela wytrenowanego w rozpoznawaniu twarzy o określonych strukturach jako wyrażających górna warga raiser - nawet gdy są neutralni lub uśmiechnięci.
Pozyskiwanie "zróżnicowanego zestawu danych" nie ma znaczenia, jeśli twoje etykiety są niedokładne.
Takie szkolenie wyjaśniają ustalenia Lauren Rhue z Zrozumienie ukrytej tendencyjności u SI odczytujących emocje.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
Obecność tendencyjnego etykietowania emocji będzie utrzymywać się nawet wtedy, gdy odejdzie się od podejścia opartego na FACS i będzie się starać, aby osoby etykietujące klasyfikowały emocje holistycznie.
Tekst: tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
W przypadku, gdy nie jest jasne, dlaczego holistyczne etykietowanie emocji jest tak samo prawdopodobne, aby zawieść (jeśli nie, bardziej) -. OTO ODŚWIEŻENIE:
- Ludzie inaczej wydobywają informacje patrząc na twarze i szukają różnych wskazówek przy interpretacji emocji.
- Kultura głęboko wpływa na to, co uważamy za wartościowe informacje i wskazówki.
Badania wykazały:
- wschodnioazjatycki uczestnicy mają tendencję do skupiania się na środku twarzy, wokół nosa, przywiązując większą wagę do oczu i kierunku spojrzenia.
- Zachodniokaukaski uczestnicy mają tendencję do szukania wyrazów emocji w brwiach i okolicach ust
- Te różnice w uwadze tworzą błędy, gdy uczestnicy patrzą na twarze o sprzecznych wyrazach.
np. Gdy przy szczęśliwych ustach są smutne oczy:
- Japońscy uczestnicy przywiązują większą wagę do emocji okazywanych w oczach
- Amerykańscy uczestnicy bardziej dbają o okolice ust.
Tekst: Co się dzieje, gdy nie używasz FACS prawidłowo?
- nieprawidłowa klasyfikacja wyrażeń
- niespójna klasyfikacja wyrazów
- tendencyjne etykietowanie (rasowe, kulturowe, związane z wiekiem itp.)
- anarchia
Nawet przy prawidłowym stosowaniu FACS zawsze będzie występować stronniczość i niespójność - ale podejmując staranne działania, można te problemy znacznie ograniczyć.
Tekst: anarchia
Jeśli .
- kultura wpływa na to, jak interpretujemy wypowiedzi i emocje
- warunki środowiskowe wpływają na to, na jakie wskazówki patrzymy, aby ocenić twarz
- wiedza o działaniach na twarzy wpływa na to, jak oznaczamy ekspresje
. . . Co mogą zrobić firmy technologiczne, aby ograniczyć te ludzkie błędy i zapobiec ich wyciekowi w algorytmy?
Tekst: Co mogą zrobić firmy technologiczne, aby zmniejszyć tendencyjność w śledzeniu twarzy?
- Firmy technologiczne muszą uznać, że Śledzenie twarzy wyszło poza ramy inżynierii.
- Firmy technologiczne muszą zaakceptować podatność technologii na uprzedzenia i edukować pracowników w tym zakresie.
- Firmy technologiczne muszą zainwestować więcej w jakość danych.
Tekst: Uznanie postępu technologii śledzenia twarzy, zrozumienie jej słabości i większe inwestycje w jakość danych oznacza . . .
- Właściwie przydzielanie etatów w kierunku ról skoncentrowanych na jakości danych - nawet jeśli wymaga to zajęcia miejsca na stanowiskach inżynierskich.
- Poświęcenie czasu, energii, oraz zasoby do znaleźć specjalistów od danych. Jeśli nie jest to możliwe, to nadal zadaniem firmy jest poświęcenie czasu, energii i środków na SZKOLENIE specjalistów od danych. Klasyfikacja wyrazów twarzy jest znacznie bardziej skomplikowana niż klasyfikacja podstawowych obiektów, takich jak sygnały drogowe, i powinna być traktowana jako taka.
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Uznanie postępu technologii śledzenia twarzy, zrozumienie jej słabości i większe inwestycje w jakość danych oznacza . . .
- Inżynieria, badania i produkt nie powinny po prostu mówić danym, czego potrzebują - ale SŁUCHAĆ do tego, czego potrzebują zespoły zajmujące się danymi. Zespoły danych mają największą wiedzę na temat zakulisowych prac wymaganych do funkcjonowania algorytmów. W TYM MIEJSCU WIELE FIRM PONOSI PORAŻKĘ.
- Wymaganie od pracowników pełniących role związane z danymi, aby regularnie kontaktowali się z zespołami inżynieryjnymi, badawczymi i produktowymi.
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Uznanie postępu technologii śledzenia twarzy, zrozumienie jej słabości i większe inwestycje w jakość danych oznacza . . .
- Edukacja pracowników na temat rzeczywistości bias in tech.
- Podjęcie właściwych środków ostrożności w celu standaryzacja i definiowanie etykiet.
- Zawsze rozważenie, kiedy i gdzie może pojawić się stronniczość.
- Kto ma etykietę?
- Co oni oznaczają?
- Jakie czynniki mogą wpływać na ich oznakowanie?
* nastrój * kultura * doświadczenie
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Uznanie postępu technologii śledzenia twarzy, zrozumienie jej słabości i większe inwestycje w jakość danych oznacza . . .
SIDENOTE: ZATRZYMANIE ETYKIETOWANIA WYRAŻEŃ ZE STATYCZNYCH OBRAZÓW.
- Precyzyjny FACS i etykietowanie emocji jest w dużej mierze uzależnione od widzenia ruchu.
- Gdyby ruch był bardziej akcentowany, statyczne cechy twarzy, takie jak opadające kąciki ust i zakrzywione bruzdy nosowo-wargowe, byłyby mniej skłonne do aktywowania detekcji depresor narożnika wargowego oraz górna warga raiser (odpowiednio).
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Uwagi dotyczące zamknięcia . . .
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Im bardziej wierzymy i polegamy na technologii, tym większe konsekwencje będą miały te uprzedzenia.
Tekst: Zmniejszanie błędów w śledzeniu twarzy
"... oprogramowanie do rozpoznawania twarzy inaczej interpretuje emocje w zależności od rasy danej osoby. ...To odkrycie ma implikacje dla jednostek, organizacji i społeczeństwa, a także przyczynia się do rosnącej literatury na temat stronniczości i / lub nierównego wpływu w AI."
Rhue, Lauren, Wpływ rasy na zautomatyzowane postrzeganie emocji (9 listopada 2018 r.). Dostępne na SSRN: https://ssrn.com/abstract=3281765 lub http://dx.doi.org/10.2139/ssrn.3281765
Tekst: Zmniejszanie błędów w śledzeniu twarzy
Weź odpowiedzialność.
Włóż pracę, aby zmniejszyć stronniczość.
Więcej inwestuj w dane.
Tekst:
W odpowiedzi na powszechność niskiej jakości i niedokładnych referencji FACS, Stworzyłem darmowy "FACS Cheat Sheet" aby służyć jako przewodnik dla artystów, badaczy i inżynierów. Jest on dostępny na mojej stronie z zasobami FACS, Zmierz się z FACS-em. Jestem również otwarta na doradztwo.
1 komentarz do “Bias In Emotion Tracking”
Możliwość komentowania została wyłączona.