Büyük Teknolojinin Homojen İşe Alım Alışkanlıkları Verilerimize Zarar Veriyor

Tüketici odaklı dijital dünyamızda, inovasyon yapmak ve yeni ürünler geliştirmek için bir aciliyet ürettik. Makine öğrenimi trendi ve hızlı hareket etme ve bir şeyleri kırma - yani "inşa etme" - baskısı ile Big Tech sürekli olarak inşaatçılara ihtiyaç duyuyor. Sonuç olarak, yazılım mühendisleri, personel sayısını domine eden ve şirketler arasında ihale savaşlarına yol açan, oldukça rağbet gören bir meta haline geldi. Ancak, makine öğrenimi hedefleri büyüdükçe veri ihtiyaçları da büyüyor ve mühendis merkezli sorunları disiplinler arası meselelere dönüştürüyor. Yüz takibi için yüz ifadeleri gibi son derece belirsiz veriler üreten projeler, verilerin mühendislik kapsamının ötesinde anlaşılmasını gerektirir; mühendislik ve uygulanan tamamlayıcı alan arasında disiplinler arası bir evlilik gerektirir. Bu nedenle, teknoloji firmalarının ürün geliştirme sürecine alan uzmanlarını dahil ederek veri bütünlüğü konusunda sorumluluk almaları kritik önem taşımaktadır.

Big Tech'in kültüründe mühendislik dışı rollere öncelik vermek olmasa da, diğer sektörler makine öğreniminde güncel uzmanlığın önemini kabul etmektedir. Örneğin biyoteknoloji alanı, hem tıp uzmanları hem de biyoteknoloji uzmanları arasındaki işbirliğine dayanır. ve mühendisler. Bu durumda işbirliğine duyulan ihtiyaç açıktır, ancak daha belirsiz uzmanlık alanlarında ihtiyaç her zaman belirgin değildir. Daha önce de değinildiği gibi, bilinmezlik ve anlayış eksikliğinden muzdarip önemli bir alan yüz izlemedir. Yüz filtreleri, ürün reklamları için özellik algılama (örneğin ruj ürünlerini test etmek için dudak algılama veya gözlükler için göz algılama) ve avatarlar dahil olmak üzere yüz izleme için yaygın kullanım durumları nispeten zararsızdır. Ancak, ceza adaleti sistemi, sigorta sektörü veya siber güvenlik dünyasındaki uygulamalarla duygu tespiti, davranış izleme ve aldatma tespiti gibi daha az "sevimli" kullanım durumları düşünüldüğünde, bir makine öğrenimi modelinin performansı tartışmalı hale gelir; ve yanlış şekilde yapılırsa tehlikeli hale gelir. Yüz tanıma teknolojisi ve bu teknolojinin farklı ülke ve sektörlerde düzensiz kullanımıyla ilgili halihazırda bilinen pek çok sorun var. Yüz ifadesi takibi sadece bir kişiyi tanımlamakla kalmayıp, o kişinin davranışlarını gözlemleyip sonuçlar çıkardığından, çok daha istilacı olma kapasitesine sahiptir.

Yüz takibi için ifade verilerinin temel önemine rağmen, Büyük Teknoloji genellikle ifade verisi kalitesine öncelik vermemektedir. Ürün yöneticileri, mühendislik yöneticileri, kullanıcı araştırmacıları ve yazılım mühendisleri genellikle bir uzmanın sağlayabileceği derinlemesine anlayıştan faydalanmak yerine kendi yüzeysel anlayışlarına ve geçici araştırmalarına güvenmektedir. Yazılım mühendisleri algoritma oluşturmada ustalaşmış olsalar da, genellikle verinin içinde ne olduğuna dair üstünkörü bir bilgiye sahiptirler. Yüksek baskı altındaki iş yükleri ve kendi uzmanlık bilgilerine odaklanmaları göz önüne alındığında, mühendislerin ince ifade verilerini inceleme veya duygu araştırmalarındaki karmaşık kavramlara hakim olma konusunda ek bir uzmanlık geliştirmeleri mümkün değildir.

Ne tür verilere ihtiyaç duyulduğunun, bunların nasıl toplanacağının ve nasıl etiketleneceğinin belirlenmesi hassas süreç. Yanlış verileri hedeflemeyi seçerseniz, bu verileri ne kadar iyi topladığınız veya etiketlediğiniz önemli olmayacaktır. Yararlı verileri hedefler ancak yanlış toplarsanız, bu da başarısız olacaktır. Tam ve/veya doğru bir şekilde etiketlemezseniz yine başarısız olacaktır. Yüz özelliklerindeki morfolojik farklılıklar, ifade yorumlamasındaki doğal önyargılar ve hem duygu araştırmacıları hem de yüz anatomistleri arasındaki tartışmalar nedeniyle, ruj almadan önce denemenin ötesinde niyetlerle yüz izleme algoritmaları geliştiren herhangi bir grup, veri bütünlüğü için hesap verebilirliği ve etik sorumluluğu kabul etmelidir.

Algoritmalarının yapı taşlarının onları kullananlar tarafından iyi anlaşılmasını sağlamak yerine, Büyük Teknoloji'nin talihsiz durumu, büyük miktarda veri toplamak veya elde etmek ve bunları üçüncü taraf etiketleyicilere aktarmaktır. Etiketleyiciler genellikle dış kaynaklıdır, sözleşmelidir ve neredeyse her zaman değerlerinin altındadır. Etiketlerin kalitesini izlemek için standart, çeşitli Temel Performans Göstergeleri veya KPI'lar oluşturmak ve uygulamaktır, ancak Big Tech, gelişmiş verilerin kalitesini meşru bir şekilde denetleyebilecek kişilere kaynak yatırımı yapmamayı tercih ettiğinden, KPI'lar genellikle keyfidir ve çok az değere sahiptir. Sorunu daha da derinleştirecek olursak, mühendisler temel gerçekleri belirleyecek anlayış derinliğine sahip değillerse, gerçekte neyi ölçüyorlar? Denetimsiz öğrenme var. Ve bir de denetimsiz mühendislik vardır.

Silikon Vadisi'ndeki Beş Büyük şirketten birinde çalışırken, karmaşık yüz izleme verilerine ilişkin soğukkanlı zihniyet beni sürekli şoke ediyordu. Meslektaşlarım algoritma geliştirmede öncü kişiler olmalarına rağmen yüz anatomisi, temel duygu kavramları ve ifade davranışları hakkında yüzeysel bir anlayışa sahiptiler. Diğer tüm son derece uzmanlık gerektiren konular gibi, insan ifadesinin nüanslarını anlamak da yıllar süren yoğun bir çalışma ve deneyim gerektirir. Hayatımı ve kariyerimi insan yüzünün nüanslarını anlamaya adamış bir yüz ifadesi uzmanı olmama rağmen, önemli toplantılardan ve planlama oturumlarından düzenli olarak dışlanıyordum. Sık sık iş arkadaşlarımı modası geçmiş ve yanlış ifade referans sayfalarını (ki şu anda bu sayfaları kullanıyorum) gelişigüzel karıştırırken yakalıyordum. burası için yeni çözümler sunmak) bir veri hattı planını bir araya getirme girişimlerinde bulundum. Uzmanlığım sık sık denetleyici bir role indirgendi ve becerilerim sakal tiplerini ve saç rengini sınıflandırmak gibi alakasız görevlerde kötüye kullanıldı. Veri tutarsızlıklarındaki eğilimleri işaretlediğimde veya donanım sorunlarını öngördüğümde, oturtuldum ve "makine öğrenimi nasıl çalışır" konusunda bir ders aldım.

Yüz izleme konusunda X yıllık deneyim talep eden birçok iş ilanı görüyorum, ancak ilgili deneyimi talep etmek yeterli değil. Nasıl ki bir mühendisin geçmişte tıp teknolojisinde çalışmış olması onu tıp doktoru yapmaya yetmiyorsa, sadece izleme teknolojisi üzerinde çalışmış olmak da bir mühendisi yüz ifadeleri ya da duygular konusunda otorite yapmaya yetmiyor. Uygun uzmanların işe alınmasına daha fazla odaklanılsa, belki de nadir ve özel deneyime sahip mühendisler bulma mücadelesi hafifletilebilir; böyle bir hafifletme, mühendislik ile eşleştirilebileceği tamamlayıcı disiplinler arasında daha yenilikçi işbirliğine yer açabilir.

Big Tech'in mühendisliğe odaklanan tünel vizyonu, değişmesi gereken ihmalkâr bir alışkanlıktır. Yazılım mühendisleri makine öğrenimi süreci için gerçekten gerekli olsa da, makine öğrenimi tutkusu bizi disiplinler arası eylem ihtiyacını kabul etmemiz gereken bir noktaya getirdi. Nüanslara bağlı sistemler için veriler hafife alınmamalıdır - özellikle de istilacı kullanım durumları için potansiyel taşıdıkları zaman. Şirketler veri konusundaki uzmanlığa mühendislik uzmanlığına gösterdikleri saygı ve desteğin aynısını gösterirlerse, algoritmalar ve oluşturuldukları veriler daha kapsamlı ve daha az hatalı olacaktır. Bütünsel veri sistemlerinin eksikliği bizi önyargıya açık, düzenlenmemiş ürünlerle baş başa bırakacaktır. Algoritmalara yönelen ve veri kalitesinden uzaklaşan bir yatırım dengesizliği, mühendislik çabalarının boşa gitmesine, eksik ürünlere ve etik olmayan teknolojinin yayılmasına yol açacaktır.

Tüm personel sayınızı tek bir sepete koymayın. Sorumlu bir şekilde işe alın.

“Big Tech’s Homogeneous Hiring Habits Are Harming Our Data” üzerine bir yorum

Yorum yapın

Bu site spam'i azaltmak için Akismet kullanmaktadır. Yorum verilerinizin nasıl işlendiğini öğrenin.

Stüdyolar ve ekipler için tasarlanmıştır

Hadi konuşalım.

facetheFACS@melindaozel.com