Tabiat Pengambilan Kakitangan Homogen Syarikat Teknologi Gergasi Mencederakan Data Kita

Dalam dunia digital kita yang berfokus pada pengguna, kita telah mencipta rasa kecemasan untuk berinovasi dan membangunkan produk baharu. Dengan pembelajaran mesin yang sedang menjadi tren dan tekanan berterusan untuk bergerak pantas dan memecahkan – maksud saya “membina” – sesuatu, Gergasi Teknologi sentiasa memerlukan pembina. Akibatnya, jurutera perisian telah menjadi komoditi yang sangat diidamkan, mendominasi bilangan kakitangan dan mencetuskan perang bidaan di kalangan syarikat. Namun, apabila cita-cita dalam pembelajaran mesin berkembang, keperluan data turut meningkat, menjadikan masalah yang berpusat pada jurutera berubah menjadi perkara antara disiplin. Projek yang menghasilkan data yang sangat samar – seperti ekspresi wajah untuk penjejakan muka – memerlukan pemahaman tentang data di luar skop kejuruteraan; ia memerlukan perkahwinan antara disiplin antara kejuruteraan dan bidang pelengkap yang digunakan. Oleh itu, adalah penting bagi firma teknologi untuk memikul tanggungjawab terhadap integriti data dengan melibatkan pakar bidang dalam proses pembangunan produk.

Walaupun bukan budaya syarikat Big Tech untuk memprioritaskan peranan bukan kejuruteraan, industri lain mengakui kepentingan kepakaran khusus dalam pembelajaran mesin. Contohnya, bidang bioteknologi bergantung kepada kerjasama antara pakar perubatan dan jurutera. Dalam kes ini, keperluan untuk kerjasama adalah jelas, tetapi dalam bidang kepakaran yang lebih samar, keperluan itu tidak selalu nyata. Seperti yang dirujuk sebelum ini, satu bidang utama yang mengalami kekaburan dan kekurangan pemahaman ialah penjejakan muka. Kes penggunaan biasa untuk penjejakan muka – termasuk penapis muka, pengesanan ciri untuk pengiklanan produk (contohnya pengesanan bibir untuk menguji produk gincu atau pengesanan mata untuk cermin mata) dan avatar – adalah agak tidak berbahaya. Walau bagaimanapun, apabila mempertimbangkan kes penggunaan yang kurang “comel” seperti pengesanan emosi, pemantauan tingkah laku, dan pengesanan penipuan dengan aplikasi dalam sistem keadilan jenayah, sektor insurans, atau dunia keselamatan siber – prestasi model pembelajaran mesin menjadi dipertikaikan; dan jika dilakukan dengan cara yang salah, ia menjadi berbahaya. Terdapat banyak isu yang sudah diketahui mengenai teknologi pengecaman muka dan penggunaan tanpa kawal seliaannya di pelbagai negara dan industri. Oleh kerana penjejakan ekspresi muka tidak semata-mata mengenal pasti seseorang, tetapi sebaliknya memerhati dan membuat kesimpulan tentang tingkah laku individu tersebut, ia berpotensi menjadi lebih menceroboh.

Walaupun kepentingan asas data ekspresi untuk penjejakan muka, syarikat Big Tech sering gagal memprioritaskan kualiti data ekspresi. Pengurus produk, pengurus kejuruteraan, penyelidik pengguna, dan jurutera perisian lazimnya bergantung pada pemahaman cetek mereka sendiri dan carian ad hoc berbanding memanfaatkan kefahaman mendalam yang boleh disediakan oleh seorang pakar. Walaupun jurutera perisian adalah pakar dalam mencipta algoritma, mereka sering hanya mempunyai pengetahuan dangkal tentang apa yang terkandung dalam data tersebut. Memandangkan beban kerja mereka yang sangat menekan dan tumpuan pada pengetahuan khusus masing-masing, adalah tidak praktikal bagi jurutera untuk membangunkan kepakaran tambahan dalam meneliti data ekspresi yang halus atau menguasai konsep kompleks dalam penyelidikan emosi.

Menentukan jenis data yang diperlukan, cara mengumpulkannya, dan cara melabelnya adalah proses yang halus. Jika anda memilih untuk mensasarkan data yang salah, tidak kira betapa baiknya anda mengumpul atau melabelnya. Jika anda menyasarkan data yang berguna tetapi mengumpulkannya dengan cara yang tidak betul, ia juga akan gagal. Ia akan gagal sekali lagi jika anda tidak melabelnya dengan tepat dan/atau akurat. Disebabkan perbezaan morfologi ciri wajah, bias yang wujud dalam tafsiran ekspresi, dan kontroversi di kalangan penyelidik emosi serta ahli anatomi wajah, mana-mana kumpulan yang membangunkan algoritma penjejakan wajah dengan niat melangkaui 'cuba sebelum beli' gincu mesti menerima akauntabiliti dan tanggungjawab etika terhadap integriti data.

Daripada memastikan blok binaan algoritma mereka difahami dengan baik oleh mereka yang menggunakannya, keadaan malang Big Tech ialah mengumpul atau memperoleh sejumlah besar data dan menyerahkannya kepada pihak ketiga yang melabel. Pihak yang melabel biasanya dikontrakkan secara luar, diupah berdasarkan kontrak, dan hampir selalu tidak dihargai. Untuk memantau kualiti label, piawainya adalah mencipta dan menguatkuasakan pelbagai Penunjuk Prestasi Utama, atau KPI, tetapi kerana Big Tech memilih untuk tidak melabur sumber pada orang yang boleh menyelia kualiti data lanjutan secara sah, KPI itu umumnya sewenang-wenangnya dan tidak mempunyai banyak nilai. Menambahkan lagi masalah, jika jurutera tidak dilengkapi dengan pemahaman mendalam untuk mengenal pasti kebenaran asas, apa sebenarnya yang mereka ukur? Terdapat pembelajaran tanpa pengawasan. Dan kemudian terdapat kejuruteraan tanpa pengawasan.

Apabila saya bekerja di salah satu daripada lima syarikat terkemuka di Silicon Valley, saya sentiasa terkejut dengan sikap sambil lewa terhadap data penjejakan wajah yang kompleks. Walaupun rakan sekerja saya adalah pakar terkemuka dalam pembangunan algoritma, mereka mempunyai pemahaman yang cetek tentang anatomi wajah, konsep emosi teras, dan tingkah laku ekspresi. Seperti mana-mana bidang yang sangat khusus, memahami selok-belok ekspresi manusia memerlukan bertahun-tahun kajian intensif dan pengalaman. Walaupun saya adalah pakar ekspresi wajah yang menumpukan hidup dan kerjaya saya untuk memahami selok-belok wajah manusia, saya sering dikecualikan daripada mesyuarat penting dan sesi perancangan. Saya sering melihat rakan sekerja dengan tergesa-gesa meneliti halaman rujukan ekspresi yang lapuk dan tidak tepat (yang saya sedang menyediakan penyelesaian baharu untuk di sini) dalam usaha menyusun rancangan saluran data secara tergesa-gesa. Kepakaran saya sering dipinggirkan ke peranan penyelia, dan kemahiran saya disalahgunakan untuk tugasan tidak relevan seperti mengklasifikasikan jenis misai dan warna rambut. Apabila saya menandakan tren ketidakkonsistenan data atau meramalkan masalah perkakasan, saya dipanggil dan diberikan pelajaran tentang “bagaimana pembelajaran mesin berfungsi.”

Saya melihat banyak iklan kerja meminta X tahun pengalaman dalam penjejakan wajah, tetapi meminta pengalaman berkaitan sahaja tidak mencukupi. Sama seperti kerja lalu seorang jurutera dalam teknologi perubatan tidak melayakkan mereka menjadi pengamal perubatan, sekadar pernah bekerja dalam teknologi penjejakan tidak melayakkan seorang jurutera menjadi pakar dalam ekspresi wajah atau emosi. Sekiranya lebih tumpuan diberikan kepada pengambilan pakar yang sesuai, mungkin kesukaran mencari jurutera dengan pengalaman yang jarang dan khusus akan berkurangan; pengurangan ini boleh membuka ruang untuk kerjasama yang lebih inovatif antara kejuruteraan dan disiplin pelengkap yang boleh digabungkannya.

Fokus terowong Big Tech terhadap kejuruteraan adalah tabiat cuai yang perlu diubah. Walaupun jurutera perisian sememangnya penting dalam proses pembelajaran mesin, cita-cita pembelajaran mesin telah membawa kita ke tahap di mana kita mesti mengiktiraf keperluan tindakan antara disiplin. Data bagi sistem yang bergantung pada nuansa tidak boleh dipandang enteng – terutamanya apabila ia berpotensi untuk kegunaan pencerobohan. Jika syarikat menghargai kepakaran dalam bidang data dengan penghormatan dan sokongan yang sama seperti mereka menghargai kepakaran kejuruteraan, algoritma dan Data yang menjadi asasnya akan menjadi lebih menyeluruh dan kurang berpotensi silap. Kekurangan sistem data holistik akan meninggalkan kita dengan produk yang tidak terkawal dan mudah terdedah kepada bias. Ketidakseimbangan pelaburan yang memihak kepada algoritma dan mengabaikan kualiti data akan menyebabkan pembaziran usaha kejuruteraan, produk yang tidak mencukupi, dan penyebaran teknologi tidak beretika.

Jangan letakkan semua kakitangan anda dalam satu bakul. Ambil pekerja dengan bertanggungjawab.

1 memikirkan “Big Tech’s Homogeneous Hiring Habits Are Harming Our Data”

Tinggalkan komen

Laman ini menggunakan Akismet untuk mengurangkan spam. Pelajari bagaimana data komen anda diproses.

Direka untuk studio dan pasukan

Mari kita bercakap.

facetheFACS@melindaozel.com