Distorsioni nel tracciamento di volti ed emozioni
Sembriamo sottoscrivere l'eccessiva semplificazione popolare che le macchine sono meno parziali degli umani; tuttavia, se avete familiarità con i modi in cui le macchine sono addestrate a leggere e concentrarsi su diversi aspetti dei dati, lo saprete: Non è così semplice.
Le macchine non sono esenti da pregiudizi se sono addestrate dall'uomo.
Di seguito vengono presentati i diversi tipi di distorsioni che possono verificarsi nel tracciamento dei volti e nell'etichettatura delle espressioni. Molte di queste distorsioni possono essere ridotte; per questo ho incluso anche suggerimenti per migliorare i metodi. Se state lavorando sul tracciamento dei volti e delle emozioni di qualsiasi tipo, è vostra responsabilità essere consapevoli di questi pregiudizi.
Visualizza le diapositive qui sotto O il video collegato qui: Video YouTube
Testo: Molti volti e tracciamento delle emozioni aziende provare per usare il termine di Paul Ekman Sistema di codifica dell'azione facciale (FACS)
- ma molti non si prendono il tempo di usarlo nel modo giusto.
Testo: Cosa succede quando non si utilizza correttamente il FACS?
- classificazione delle espressioni non corrette
- classificazione delle espressioni incoerenti
- etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- anarchia
Anche se si usa il FACS in modo appropriato, ci saranno sempre pregiudizi e incoerenze, ma adottando misure accurate, questi problemi possono essere ridotti in modo significativo.
Testo: classificazione delle espressioni non corrette
- Le azioni facciali sono sottili e difficili da distinguere senza uno studio intensivo.
- La maggior parte dei riferimenti FACS (escluso il manuale FACS originale) forniscono immagini FACS non corrette, anche a fonti considerate credibili.
- Nonostante queste imprecisioni, tali fonti sono spesso utilizzate come riferimento da ingegneri e ricercatori in materia di tracciamento dei volti.
- Poiché le aziende tecnologiche non investono abbastanza in ruoli basati sui dati, è probabile che non dispongano del personale o delle risorse giuste per differenziare le azioni facciali importanti.
Testo: classificazione delle espressioni non corrette
- Forme di base come "Stringitore per labbra" vengono regolarmente confusi con azioni come "pressatore a labbra" e/o "labbro pucker.”
- Tensore per le labbra è importante in: espressioni di emozioni & produzione vocale
Testo: classificazione delle espressioni non corrette
- Qui sopra è riportata una rappresentazione fedele del tensore per labbra.
- Questa è solo una delle tante forme che ogni volta passano inosservate:
– errato – classificati in modo errato – abusato
Testo: Cosa succede quando non si utilizza correttamente il FACS?
- classificazione delle espressioni non corrette
- classificazione delle espressioni incoerenti
- etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- anarchia
Anche se si usa il FACS in modo appropriato, ci saranno sempre pregiudizi e incoerenze, ma adottando misure accurate, questi problemi possono essere ridotti in modo significativo.
Testo: classificazione delle espressioni non corrette
Gli stessi problemi legati alla classificazione errata contribuiscono anch'essi a una classificazione incoerente.
Testo: classificazione delle espressioni incoerenti
Se le aziende tecnologiche non investono a fondo nella qualità dei dati, le loro regole di classificazione dei dati non possono essere standardizzate.
A causa di:
- la mancanza di investimenti nell'assunzione e/o nella formazione di dipendenti per ruoli basati sui dati
- la mancanza di risorse FACS di qualità
- una difficoltà intrinseca nel differenziare le azioni facciali
→ Gli etichettatori classificano le espressioni in modo incoerente.
→ Gli inseguitori sviluppano stranezze, legando tra loro espressioni errate e confondendo gli altri.
Testo: classificazione delle espressioni incoerenti
NOTA: Questo diagramma è stato realizzato per spiegare i problemi di attivazione della forma per gli avatar, ma gli stessi concetti di base si applicano al tracciamento dei volti e delle emozioni.
Testo: Cosa succede quando non si utilizza correttamente il FACS?
- classificazione delle espressioni non corrette
- classificazione delle espressioni incoerenti
- etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- anarchia
Anche se si usa il FACS in modo appropriato, ci saranno sempre pregiudizi e incoerenze, ma adottando misure accurate, questi problemi possono essere ridotti in modo significativo.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Quando le etichette di espressione sono mal definite e poco comprensibili, piccoli errori possono creare grandi pregiudizi.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Prima di esaminare i pregiudizi che possono esistere nella tecnologia di tracciamento dei volti, consideriamo i pregiudizi già esistenti nella tecnologia di identificazione delle caratteristiche: il riconoscimento facciale.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Se non riusciamo nemmeno a rilevare correttamente le caratteristiche, immaginate quanto possa essere complicato il bias nel rilevamento delle espressioni. Il rilevamento delle espressioni richiede una comprensione che va oltre i tratti del viso. Richiede una comprensione dei sottili movimenti facciali.
-
Blais, Caroline & Jack, Rachael & Scheepers, Christoph & Fiset, Daniel & Caldara, Roberto. La cultura modella il modo in cui guardiamo i volti. (2008).PloS one. 3. e3022. 10.1371/journal.pone.0003022.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- Le persone estraggono informazioni in modo diverso quando guardano i volti e cercano indizi diversi nell'interpretazione delle emozioni.
- La cultura influenza profondamente ciò che consideriamo informazioni e indizi preziosi.
Gli studi hanno rilevato che:
- Asia orientale partecipanti tendono a concentrarsi sulla parte centrale del viso, intorno al naso, dando più importanza agli occhi e alla direzione dello sguardo.
- Caucasico occidentale i partecipanti tendono a cercare le espressioni di emozione nelle sopracciglia e nelle zone della bocca
- Queste differenze di attenzione creano pregiudizi quando i partecipanti guardano volti con espressioni contrastanti.
Ad esempio, quando ci sono occhi tristi con una bocca felice:
- I partecipanti giapponesi danno più importanza alle emozioni mostrate negli occhi
- I partecipanti americani si preoccupano maggiormente della zona della bocca.
1. Blais, C., Jack, R. E., Scheepers, C., Fiset, D. e Caldara, R. (2008). La cultura modella il modo in cui guardiamo i volti. PLoS ONE 3:e3022. doi: 10.1371/journal.pone.0003022
2. Elfenbein, H. A. e Ambady, N. (2003). Universali e differenze culturali nel riconoscimento delle emozioni. Current Directions in Psychological Science, 12(5), 159-164.
3. Matsumoto, D., Kasri, F. e Kooken, K. (1999). Differenze culturali tra americani e giapponesi nei giudizi sull'intensità dell'espressione e sull'esperienza soggettiva. Cognition & Emotion, 13(2), 201-218.
4. Matsumoto, D., & Ekman, P. (1989). Differenze culturali tra americani e giapponesi nella valutazione dell'intensità delle espressioni facciali delle emozioni. Motivazione ed emozione, 13(2), 143-157.
5. Marsh, A. A., Elfenbein, H. A., & Ambady, N. (2003). Differenze culturali di "accenti" non verbali nelle espressioni facciali delle emozioni. Psychological Science, 14(4), 373-376.
6. Yuki, M., Maddux, W. W., & Masuda, T. (2007). Le finestre dell'anima sono le stesse in Oriente e in Occidente? Differenze culturali nell'uso degli occhi e della bocca come spunti per riconoscere le emozioni in Giappone e negli Stati Uniti. Journal of Experimental Social Psychology, 43(2), 303-311.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Consideriamo ora ciò che va nell'etichettatura delle espressioni...
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- Se depressore per angolo labiale non è compreso correttamente, gli etichettatori hanno maggiori probabilità di classificare in modo errato qualsiasi forma con gli angoli delle labbra cadenti come depressore per angolo labiale. Queste forme mal classificate sono spesso causate dagli effetti di mentoniera – ma possono anche includere qualcosa di peggiore: volti neutri (volti privi di espressione).
- Un risultato probabile di questo malinteso è: sovra-rilevazione di depressore per angolo labiale nelle persone con angoli delle labbra cadenti. Spesso gli anziani presentano angoli della bocca cadenti a causa degli effetti a lungo termine della gravità.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- A causa di pratiche di etichettatura improprie, i gruppi demografici più anziani possono essere soggetti a un'eccessiva individuazione di depressore per angolo labiale.
- Il depressore angolare per le labbra è un componente chiave della tristezza. Questo errore potrebbe portare a una sovra-rilevazione della tristezza nei gruppi demografici più anziani?
- Che dire di altri gruppi i cui tratti del viso sono caratterizzati da angoli delle labbra cadenti? Verranno erroneamente interpretati come "tristi"?
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- Potrebbe non sembrare un grosso problema se un tracker rileva in modo errato depressore per angolo labiale oppure tristezza, ma: Cosa succede quando il tracciamento del volto viene utilizzato per cose più importanti, come le valutazioni della salute mentale o la valutazione di potenziali candidati al lavoro?
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- L'intelligenza artificiale sta analizzando le espressioni facciali dei candidati durante i colloqui di lavoro - Unilever, IBM, Dunkin Donuts e molti altri stanno già utilizzando questa tecnologia
- La tecnologia per il riconoscimento delle emozioni non funziona, ma i professionisti delle assunzioni e altri la usano comunque: un rapporto
- L'intelligenza artificiale per il rilevamento delle emozioni è un'industria da $20 miliardi. Una nuova ricerca afferma che non è in grado di fare ciò che sostiene.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Abbiamo parlato di come un'etichettatura impropria possa istigare pregiudizi nei confronti delle popolazioni più anziane.... . . Ma che dire di altri pregiudizi nei confronti di persone con determinati tratti del viso?
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
". I programmi di riconoscimento facciale presentano due tipi distinti di pregiudizi.
Primo, I volti neri sono stati costantemente giudicati più arrabbiati di quelli bianchi per ogni sorriso. Face++ ha mostrato questo tipo di pregiudizio. Secondo, le facce nere sono sempre state considerate più arrabbiate se c'era qualche ambiguità sulla loro espressione facciale. Face API ha mostrato questo tipo di disparità. Anche se i visi neri sono parzialmente sorridenti, la mia analisi ha mostrato che il hanno assunto emozioni più negative rispetto alle loro controparti bianche con espressioni simili. I punteggi emotivi medi erano molto più vicini tra le varie razze, ma c'erano ancora differenze notevoli tra i volti bianchi e neri".
Comprendere i pregiudizi nascosti nelle IA che leggono le emozioni
-Lauren Rhue
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Come potrebbe accadere?
Rivediamo perché è importante investire di più nei dati.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Considerate la forma FACS "alza labbro superiore." Alza labbro superiore è un componente chiave di emozioni come disgusto, rabbia, e disprezzo.
Le caratteristiche dell'elevatore del labbro superiore includono:
- labbro superiore sollevato
- regione del solco nasolabiale superiore arrotondata
(linea di risata - vedi foto)
NOTA: Oltre ai potenziali pregiudizi nell'etichettatura delle azioni facciali, esiste anche una controversia significativa sulla teoria delle emozioni di base (ad esempio, i prototipi delle emozioni di base come il disprezzo, la rabbia e così via) in generale. Si veda "'È tutto negli occhi" e altre bugie.“
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Alcune persone presentano una maggiore curvatura del solco nasolabiale.
Si tratta semplicemente di un prodotto della struttura naturale del viso.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Un etichettatore non adeguatamente preparato sul sistema di codifica delle azioni facciali può facilmente etichettare erroneamente persone con curve del solco nasale non basate sull'espressione come aventi alza labbro superiore.
Queste etichette errate fanno nascere un tracker addestrato a identificare i volti con determinate strutture come se esprimessero alza labbro superiore - anche quando sono neutrali o sorridenti.
Procurarsi un "insieme di dati diversificato" è irrilevante se le etichette sono imprecise.
Questo tipo di formazione spiega le scoperte di Lauren Rhue di Comprendere i pregiudizi nascosti nelle IA che leggono le emozioni.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
La presenza di un'etichettatura distorta delle emozioni persiste anche se ci si allontana da un approccio basato sul FACS e si cerca di far classificare le emozioni in modo olistico.
Testo: etichettatura distorta (razziale, culturale, legata all'età, ecc.)
Nel caso in cui non sia chiaro il motivo per cui l'etichettatura olistica delle emozioni ha la stessa probabilità di fallire (se non addirittura di più). ECCO UN AGGIORNAMENTO:
- Le persone estraggono informazioni in modo diverso quando guardano i volti e cercano indizi diversi nell'interpretazione delle emozioni.
- La cultura influenza profondamente ciò che consideriamo informazioni e indizi preziosi.
Gli studi hanno rilevato che:
- Asia orientale i partecipanti tendono a concentrarsi sulla parte centrale del viso, intorno al naso, dando maggiore importanza agli occhi e alla direzione dello sguardo.
- Caucasico occidentale i partecipanti tendono a cercare le espressioni di emozione nelle sopracciglia e nelle zone della bocca
- Queste differenze di attenzione creano pregiudizi quando i partecipanti guardano volti con espressioni contrastanti.
Ad esempio, quando ci sono occhi tristi con una bocca felice:
- I partecipanti giapponesi danno più importanza alle emozioni mostrate negli occhi
- I partecipanti americani si preoccupano maggiormente della zona della bocca.
Testo: Cosa succede quando non si utilizza correttamente il FACS?
- classificazione delle espressioni non corrette
- classificazione delle espressioni incoerenti
- etichettatura distorta (razziale, culturale, legata all'età, ecc.)
- anarchia
Anche se si usa il FACS in modo appropriato, ci saranno sempre pregiudizi e incoerenze, ma adottando misure accurate, questi problemi possono essere ridotti in modo significativo.
Testo: anarchia
Se...
- la cultura influenza il modo in cui interpretiamo le espressioni e le emozioni
- Le condizioni ambientali influenzano gli indizi che osserviamo per valutare i volti.
- la conoscenza delle azioni facciali influenza il modo in cui etichettiamo le espressioni
. . . Cosa possono fare le aziende tecnologiche per ridurre questi errori umani e impedire che trapelino in algoritmi?
Testo: Cosa possono fare le aziende tecnologiche per ridurre i pregiudizi nel rilevamento dei volti?
- Le aziende tecnologiche devono riconoscere che Il tracciamento dei volti è andato oltre la portata dell'ingegneria.
- Le aziende tecnologiche devono accettare la vulnerabilità della tecnologia ai pregiudizi e formare i dipendenti su queste vulnerabilità.
- Le aziende tecnologiche devono investire maggiormente nella qualità dei dati.
Testo: Riconoscere i progressi della tecnologia di tracciamento dei volti, comprenderne le vulnerabilità e investire di più nella qualità dei dati significa... . .
- In realtà assegnazione dell'organico verso ruoli incentrati sulla qualità dei dati, anche se ciò richiede di sottrarre spazio all'organico dell'ingegneria.
- Spendere tempo, energia, e risorse a trovare specialisti dei dati. Se ciò non è possibile, è comunque compito dell'azienda dedicare tempo, energie e risorse alla formazione degli specialisti dei dati. Classificare le espressioni facciali è molto più complicato che classificare oggetti di base come i segnali stradali e deve essere trattato come tale.
Testo: Ridurre le distorsioni nel tracciamento dei volti
Riconoscere i progressi della tecnologia di tracciamento dei volti, comprenderne le vulnerabilità e investire di più nella qualità dei dati significa... . .
- L'ingegneria, la ricerca e il prodotto non devono limitarsi a dire ai dati ciò di cui hanno bisogno, ma ASCOLTARE. a ciò di cui hanno bisogno i team che si occupano dei dati. I team che si occupano dei dati sono i più esperti nel lavoro dietro le quinte necessario per il funzionamento degli algoritmi. È QUI CHE MOLTE AZIENDE FALLISCONO.
- Richiedere ai dipendenti con ruoli basati sui dati di interfacciarsi regolarmente con i team di ingegneria, ricerca e prodotto.
Testo: Ridurre le distorsioni nel tracciamento dei volti
Riconoscere i progressi della tecnologia di tracciamento dei volti, comprenderne le vulnerabilità e investire di più nella qualità dei dati significa... . .
- Educare i dipendenti sulla realtà dei pregiudizi nel settore tecnologico.
- Prendere le giuste precauzioni per standardizzare e definire l'etichettatura.
- Sempre considerare quando e dove possono comparire i pregiudizi.
- Chi sta etichettando?
- Cosa stanno etichettando?
- Quali fattori possono influire sulla loro etichettatura?
* umore * cultura * esperienza
Testo: Ridurre le distorsioni nel tracciamento dei volti
Riconoscere i progressi della tecnologia di tracciamento dei volti, comprenderne le vulnerabilità e investire di più nella qualità dei dati significa... . .
NOTA A MARGINE: SMETTERE DI ETICHETTARE LE ESPRESSIONI DA IMMAGINI STATICHE.
- L'etichettatura accurata del FACS e delle emozioni dipende in larga misura dalla visione del movimento.
- Se il movimento fosse maggiormente enfatizzato, le caratteristiche facciali statiche, come gli angoli delle labbra cadenti e il solco nasolabiale curvo, avrebbero meno probabilità di attivare la rilevazione di depressore per angolo labiale e alza labbro superiore (rispettivamente).
Testo: Ridurre le distorsioni nel tracciamento dei volti
Note di chiusura . . .
Testo: Ridurre le distorsioni nel tracciamento dei volti
Più crediamo e ci affidiamo alla tecnologia, più saranno le ramificazioni di questi pregiudizi.
Testo: Ridurre le distorsioni nel tracciamento dei volti
"... il software di riconoscimento facciale interpreta le emozioni in modo diverso a seconda della razza della persona. ... Questa scoperta ha implicazioni per gli individui, le organizzazioni e la società e contribuisce alla crescente letteratura sui pregiudizi e/o l'impatto disparato nell'IA".
Rhue, Lauren, Influenza razziale sulle percezioni automatiche delle emozioni (9 novembre 2018). Disponibile su SSRN: https://ssrn.com/abstract=3281765 oppure http://dx.doi.org/10.2139/ssrn.3281765
Testo: Ridurre le distorsioni nel tracciamento dei volti
Assumersi la responsabilità.
Impegnarsi per ridurre i pregiudizi.
Investire di più nei dati.
Testo:
In risposta alla prevalenza di riferimenti FACS di bassa qualità e imprecisi, Ho creato un "FACS Cheat Sheet" gratuito. come guida per artisti, ricercatori e ingegneri. È disponibile sul mio sito di risorse FACS, Affrontare il FACS. Sono disponibile anche per consulenze.
1 commento su “Bias In Emotion Tracking”
I commenti sono chiusi.