ビッグ・テックの同質的な雇用習慣が我々のデータに害を及ぼしている

消費者を中心としたデジタルの世界では、革新的な製品を開発することが急務となっています。機械学習がトレンドとなっていることに加え、迅速に行動して物事を壊し、つまり「構築」しなければならないというプレッシャーが恒常的に存在するため、ビッグテックでは常に構築者が必要とされています。その結果、ソフトウェアエンジニアは非常に人気のある商品となり、従業員数を独占して企業間の入札競争を引き起こしています。しかし、機械学習への関心が高まるにつれ、データへのニーズも高まり、エンジニア中心の問題が学際的な問題へと変化しています。顔追跡のための顔の表情のように、非常に曖昧なデータを生成するプロジェクトでは、エンジニアリングの範囲を超えたデータの理解が求められ、エンジニアリングと適用される補完的な分野との学際的な融合が必要になります。そのため、技術系企業は、製品開発プロセスに分野の専門家を組み込むことで、データの完全性に責任を持つことが重要です。

ビッグテックでは、エンジニアリング以外の役割を優先する文化はありませんが、他の業界では、機械学習における局所的な専門知識の重要性を認めています。例えば、バイオテック分野では、医学の専門家と機械学習の専門家が協力して作業を行っています。 そして エンジニアの皆さん。この場合、コラボレーションの必要性は明らかですが、より曖昧な専門分野では、その必要性は必ずしも明らかではありません。先に述べたように、不明瞭さと理解不足に悩まされている主な分野の一つがフェイストラッキングです。フェイストラッキングの一般的なユースケースは、フェイスフィルター、製品広告のための特徴検出(例:口紅製品をテストするための唇の検出、眼鏡のための目の検出)、アバターなど、比較的穏やかなものです。しかし、感情検出、行動モニタリング、欺瞞検出など、刑事司法制度や保険業界、サイバーセキュリティの世界での応用など、「かわいい」とは言えないユースケースを考えると、機械学習モデルの性能が問題となり、やり方を間違えれば危険なものとなります。顔認識技術については、すでに多くの問題が指摘されており、さまざまな国や業界で無秩序に使用されています。顔の表情を追跡することは、単に人を識別するのではなく、その人の行動を観察して結論を導き出すため、はるかに侵略的になる可能性があります。

フェイストラッキングにおける表情データの基本的な重要性にもかかわらず、ビッグテックではしばしば表情データの品質を優先していません。プロダクトマネージャー、エンジニアリングマネージャー、ユーザーリサーチャー、ソフトウェアエンジニアは、専門家が提供する深い知識よりも、自分自身の表面的な理解やその場しのぎの検索に頼ってしまいます。ソフトウェアエンジニアは、アルゴリズムを作ることには長けていますが、データの中身については大まかな知識しか持っていないことが多いのです。ソフトウェアエンジニアは、アルゴリズムを作ることには長けていますが、データの中身についてはざっくりとした知識しか持ち合わせていないことが多いのです。

どのようなデータが必要か、どのように収集するか、どのように表示するかを決めるのは 繊細なプロセス.誤ったデータを選んでしまうと、いくらデータを集めてラベルを貼っても意味がありません。有用なデータをターゲットにしても、不適切な方法で収集すれば、それも失敗に終わります。また、正確にラベルを貼らなければ、さらに失敗します。顔の特徴の形態学的な違い、表情の解釈における固有のバイアス、感情の研究者と顔の解剖学者の間での論争などの理由から、口紅を買う前に試してみるという以上の意図を持って顔追跡アルゴリズムを開発するグループは、データの完全性に対する説明責任と倫理的責任を受け入れなければなりません。

ビッグテックでは、アルゴリズムの構成要素を利用者が十分に理解できるようにするのではなく、大量のデータを収集・取得して、第三者であるラベラーに渡すという残念な状態が続いています。ラベラーは通常、外注され、契約に基づき、ほとんど常に過小評価されています。ラベルの品質を監視するためには、さまざまなKPI(重要業績評価指標)を作成して実施するのが一般的ですが、ビッグテックは高度なデータの品質を合法的に監督できる人材にリソースを投入しないため、KPIは一般的に恣意的で、ほとんど意味を持ちません。さらに問題なのは、エンジニアが真実を見極めるための深い理解力を適切に備えていない場合、実際には何を測定しているのかということです。教師なし学習があります。そして、教師なしのエンジニアリングがあります。

私は、シリコンバレーのビッグ5に属する企業で働いていたとき、複雑な顔のトラッキングデータに対する平然とした考え方に、いつもショックを受けていました。同僚たちはアルゴリズム開発の最先端を走っていたにもかかわらず、顔の解剖学的構造や感情の中核となる概念、表情の振る舞いについては浅い理解しかしていなかったのです。他の高度な専門分野と同様に、人間の表情のニュアンスを理解するには、何年もかけて集中的に勉強し、経験を積む必要があります。私は、顔のニュアンスを理解するために人生とキャリアを捧げてきた顔の専門家であるにもかかわらず、重要な会議や企画会議からいつも外されていました。同僚たちが、古くて不正確な表情のリファレンスページ(現在、私が作成しているもの)を無造作にかき集めているのをよく見かけました。 ここに新しいソリューションを提供すると、データ・パイプライン・プランの作成を試みました。私の専門知識はしばしば監督役に追いやられ、ヒゲの種類や髪の色の分類といった無関係な作業に悪用されました。データの不整合の傾向を指摘したり、ハードウェアの問題を予見したりすると、「機械学習がどのように機能するか」というレッスンを受けることになりました。

求人票に「顔面トラッキングの経験○年」と書かれていることが多いのですが、関連する経験を求めているだけでは不十分です。医療技術に携わったからといって医師になれるわけではないように、トラッキング技術に携わったからといって、顔の表情や感情の権威になれるわけではありません。適切な専門家を採用することにもっと焦点を当てれば、希少で特殊な経験を持つエンジニアを探す苦労も軽減されるかもしれません。そうすれば、エンジニアリングとそれを補完する分野との間で、より革新的なコラボレーションが可能になるでしょう。

ビッグテックがエンジニアリングを重視するのは、怠慢な習慣であり、変える必要があります。機械学習のプロセスにはソフトウェアエンジニアが欠かせませんが、機械学習の野望によって、私たちは学際的な活動の必要性を認識しなければならない段階に来ています。ニュアンスに左右されるシステムのデータを軽視してはいけません。特に、侵襲的なユースケースにつながる可能性がある場合はなおさらです。もし企業が、エンジニアリングの専門知識と同じように、データに関する専門知識を尊重し、サポートしてくれたら、アルゴリズムは、より良いものになるでしょう。 そして このようなデータシステムを構築することで、より包括的で誤りの少ないデータを得ることができます。全体的なデータシステムがないと、偏りのある規制されていない製品になってしまいます。アルゴリズムに偏った投資とデータの質に偏った投資の不均衡は、技術的な努力の無駄、欠陥のある製品、非倫理的な技術の蔓延につながります。

ヘッドカウントを一つのバスケットに入れてはいけません。責任を持って採用してください。

「Big Tech’s Homogeneous Hiring Habits Are Harming Our Data」への1件のフィードバック

コメントする

このサイトはスパムを減らすためにAkismetを使用しています。あなたのコメントデータがどのように処理されるかを知る

スタジオやチーム向けに設計されています

話しましょう。.

facetheFACS@melindaozel.com