En nuestro mundo digital centrado en el consumidor, hemos fabricado una urgencia por innovar y desarrollar productos emergentes. Con la tendencia del aprendizaje automático y una presión que se autoperpetúa para moverse rápido y romper -quiero decir "construir"- cosas, Big Tech necesita constantemente constructores. Como resultado, los ingenieros de software se han convertido en una mercancía muy codiciada, dominando la plantilla e incitando guerras de ofertas entre las empresas. Sin embargo, a medida que crecen las ambiciones de aprendizaje automático, también aumentan las necesidades de datos, lo que transforma los problemas centrados en los ingenieros en asuntos interdisciplinares. Los proyectos que generan datos muy ambiguos -como las expresiones faciales para el seguimiento de rostros- exigen una comprensión de los datos que va más allá del ámbito de la ingeniería; requieren un matrimonio interdisciplinar entre la ingeniería y el campo complementario que se aplica. Por tanto, es fundamental que las empresas tecnológicas asuman la responsabilidad de la integridad de los datos incorporando expertos en la materia al proceso de desarrollo del producto.
Aunque no está en la cultura de las grandes tecnológicas dar prioridad a las funciones no relacionadas con la ingeniería, otros sectores reconocen la importancia de los conocimientos especializados en el aprendizaje automático. El campo de la biotecnología, por ejemplo, se basa en la colaboración entre expertos médicos y ingenieros. En este caso, la necesidad de colaboración es obvia, pero en ámbitos de especialización más oscuros, la necesidad no siempre es evidente. Como ya se ha dicho, uno de los principales ámbitos que adolece de oscuridad y falta de comprensión es el seguimiento facial. Los casos de uso habituales del seguimiento facial, como los filtros faciales, la detección de rasgos para la publicidad de productos (por ejemplo, la detección de labios para probar productos de pintalabios o la detección de ojos para gafas) y los avatares, son relativamente benignos. Sin embargo, cuando se consideran casos de uso menos "bonitos", como la detección de emociones, la supervisión de comportamientos y la detección de engaños con aplicaciones en el sistema de justicia penal, el sector de los seguros o el mundo de la ciberseguridad, el rendimiento de un modelo de aprendizaje automático se vuelve polémico; y si se hace de la manera equivocada, se vuelve peligroso. Ya se conocen muchos problemas con la tecnología de reconocimiento facial y su uso no regulado en diferentes países e industrias. Dado que el seguimiento de la expresión facial no se limita a identificar a una persona, sino que más bien la observa y extrae conclusiones sobre su comportamiento, tiene la capacidad de ser mucho más invasivo.
A pesar de la importancia fundamental de los datos de expresión para el seguimiento facial, las grandes empresas tecnológicas no suelen dar prioridad a la calidad de los datos de expresión. Los jefes de producto, los directores de ingeniería, los investigadores de usuarios y los ingenieros de software suelen confiar en su propia comprensión superficial y en búsquedas ad hoc, en lugar de beneficiarse de la profundidad de comprensión que podría aportar un experto. Aunque los ingenieros de software son maestros en la creación de algoritmos, a menudo sólo poseen un conocimiento superficial de lo que contienen los datos. Dada su elevada carga de trabajo y la concentración en su propio conocimiento especializado, no es factible que los ingenieros desarrollen una experiencia adicional en el escrutinio de datos de expresión sutil o en el dominio de conceptos complejos en la investigación de las emociones.
Determinar qué tipo de datos se necesitan, cómo recopilarlos y cómo etiquetarlos es un delicado proceso. Si elige los datos equivocados, no importa lo bien que los recoja o etiquete. Si eliges datos útiles pero los recopilas de forma incorrecta, también fracasarán. Y volverá a fallar si no los etiqueta con precisión o exactitud. Debido a las diferencias morfológicas de los rasgos faciales, los sesgos inherentes a la interpretación de las expresiones y la controversia entre los investigadores de las emociones y los anatomistas faciales, cualquier grupo que desarrolle algoritmos de seguimiento facial con intenciones que vayan más allá de probar antes de comprar un pintalabios debe aceptar la responsabilidad ética de la integridad de los datos.
En lugar de asegurarse de que los componentes básicos de sus algoritmos son bien comprendidos por quienes los utilizan, la lamentable situación de las grandes empresas tecnológicas consiste en recopilar o adquirir cantidades masivas de datos y pasárselos a terceros etiquetadores. Los etiquetadores suelen ser subcontratados, contratados y casi siempre infravalorados. Para supervisar la calidad de las etiquetas, la norma es crear y hacer cumplir varios indicadores clave de rendimiento, o KPI, pero como Big Tech opta por no invertir recursos en personas que puedan supervisar legítimamente la calidad de los datos avanzados, los KPI son generalmente arbitrarios y tienen poco mérito. Para agravar el problema, si los ingenieros no están debidamente equipados con la profundidad de conocimientos necesaria para identificar las verdades básicas, ¿qué están midiendo en realidad? Existe el aprendizaje no supervisado. Y luego está la ingeniería no supervisada.
Cuando trabajaba para una de las cinco grandes empresas de Silicon Valley, no dejaba de sorprenderme la actitud indiferente ante los complejos datos de seguimiento facial. Aunque mis colegas eran líderes en el desarrollo de algoritmos, poseían un conocimiento superficial de la anatomía facial, los conceptos básicos de las emociones y el comportamiento expresivo. Como cualquier otro tema altamente especializado, comprender los matices de la expresión humana requiere años de estudio intensivo y experiencia. A pesar de que yo era la experta residente en expresión facial que había dedicado mi vida y mi carrera a comprender los matices del rostro humano, se me excluía regularmente de reuniones importantes y sesiones de planificación. A menudo sorprendía a mis compañeros de trabajo rebuscando al azar en páginas de referencia de expresión anticuadas e inexactas (que actualmente estoy aportando nuevas soluciones) para intentar elaborar un plan de canalización de datos. Mi experiencia se relegaba con frecuencia a un papel de supervisión, y mis conocimientos se empleaban mal en tareas irrelevantes como la clasificación de los tipos de barba y el color del pelo. Cuando señalaba tendencias en las incoherencias de los datos o preveía problemas de hardware, me sentaban y me ofrecían una lección sobre "cómo funciona el aprendizaje automático".
Veo muchas ofertas de empleo en las que se piden X años de experiencia en seguimiento facial, pero pedir experiencia relacionada no es suficiente. Del mismo modo que el trabajo previo de un ingeniero en tecnología médica no le cualifica para ser médico, el mero hecho de haber trabajado en tecnología de rastreo no cualifica a un ingeniero para ser una autoridad en expresiones faciales o emociones. Si se prestara más atención a contratar a los expertos adecuados, quizá se aliviaría la lucha por encontrar ingenieros con una experiencia rara y específica; ese alivio podría dejar espacio para una colaboración más innovadora entre la ingeniería y las disciplinas complementarias con las que puede emparejarse.
La visión de túnel de Big Tech centrada en la ingeniería es un hábito negligente que debe cambiar. Si bien es cierto que los ingenieros de software son esenciales para el proceso de aprendizaje automático, sus ambiciones nos han llevado a un punto en el que debemos reconocer la necesidad de una acción interdisciplinar. Los datos para sistemas que dependen de matices no deben tomarse a la ligera, sobre todo cuando destilan potencial para casos de uso invasivos. Si las empresas valoraran la experiencia en materia de datos con la misma reverencia y apoyo que lo hacen con la experiencia en ingeniería, los algoritmos y los datos a partir de los cuales se construyen serían más completos y menos falibles. La falta de sistemas de datos holísticos nos dejará con productos no regulados susceptibles de sesgo. Un desequilibrio de la inversión que se incline hacia los algoritmos y se aleje de la calidad de los datos conducirá a un esfuerzo de ingeniería malgastado, a productos deficientes y a la propagación de una tecnología poco ética.
No ponga todos sus recursos humanos en la misma cesta. Contrate con responsabilidad.
1 comentarios en “Big Tech’s Homogeneous Hiring Habits Are Harming Our Data”