为什么这么多人脸跟踪器和头像都会出现眉毛降低的假阳性问题?本分析以苹果公司的 ARKit 为案例,探讨了这一问题的根源,并在最后揭示了一个令人惊讶的简单修复方法。
头像与微笑备忘录版
假阳性眉毛下垂是人脸跟踪和头像动画中普遍存在的问题。这些错误虽然很微妙,但却会扭曲头像的表情,带来意想不到的悲伤、愤怒或担忧的暗示。在下面的视频中,我对苹果的 Memoji 进行了压力测试,以展示这一问题的实际效果。
在上面的片段中,请观察我的 Memoji 如何 "反映 "我的微笑。注意到有什么奇怪或不愉快的地方吗?我的内眉角被错误地压低了。在各种类型的微笑中,都会出现眉毛下垂的错误归因。其他用户也是如此。
眉毛下垂,上唇上扬(因上唇下垂而导致 皱鼻子者 或 戽斗)往往与不愉快的情绪有关。眉梢低垂也与微笑呈负相关。这类语义上重要的跟踪错误会无意中暗示负面情绪。
这些错误是如何产生的
眉毛降低的假阳性往往源于数据质量、标签错误和艺术选择等问题。以下是这些问题持续存在的原因:
- 对数据质量的关注不够。
- 对艺术的关注不够。
在我工作过的每一个地方,人们都非常关注雇佣有特定背景的工程师,以至于 占用了其他重要角色的人手。
许多技术带头人认为,只要获得足够的数据来训练模型,质量问题就会迎刃而解。哇神奇。这种假设通常还基于一种额外的(但错误的)信念,即不纯净数据的比例微乎其微。
我曾深入数据战壕,几乎担任过人脸跟踪领域的所有非工程职位:
- 数据规划 - 确定收集什么类型的表达式数据以及如何收集数据
- 数据收集 - 实际上是与参与者一起工作,并训练他们打出正确的表情姿势。
- 数据标注 - 确定标记地标的最佳方式
- 数据分类 - 就哪些类应该存在,它们的参数是什么,以及如何处理它们不可避免的边缘情况向工程部门提供建议。
- 扩大规模 - 确保注释和分类的规则标准化,并易于被大规模标记者理解。
- 监测跟踪 - 将实际情况与跟踪结果进行比较
- 确定需要改进的领域 - 弄清存在的问题,以及如何通过规划、收集、注释和/或分类来改进这些问题。
- 阿凡达 - 根据各种考虑因素制定优先考虑的战略,例如:
- 追踪器失效的地方
- 最终产品的使用案例是什么
- 美观
- 语意最重要
凭借我在表情科学、面部解剖学和大量面部数据方面的工作背景,我可以自信地说,不纯数据是人脸跟踪中的一个主要问题,而不是小问题。简而言之,即使算法再完美,问题还是会出现:
不纯假定数据
- 当从人类参与者那里收集姿势表达数据时,数据总是会被污染。保证。
- 大多数人不可能击中每一个目标表情。很少能找到纯粹的面部动作数据。当参与者表现出不纯正的表情时,是因为他们表现出了错误的面部动作,或者是因为他们无法在不使用额外的、非目标面部肌肉的情况下隔离出目标表情。
- 更糟糕的是,数据采集员往往无法判断参与者是否达到了目标表达。这种知识的匮乏并不是数据采集员的错,而是 X 公司的工作重点错位,不重视聘用或留住合适的人才。
不良数据标签
- 由于过度关注工程人才,公司通常会忽视数据标注职位的优先级。相反,标注工作往往被视为低级职位,指定给没有特定专业知识的承包商。
- 刚开始工作的承包商经验不足,但他们最终可以熟悉数据,从而获得专业知识;然而,这种情况很少发生,因为合同标签职位的流动率通常很高。
不知情的艺术选择
- 艺术必须了解技术,技术也必须了解艺术。在科技公司内部,艺术与工程之间存在着惊人的脱节。在很多情况下,好的追踪器之所以好看,并不是因为追踪器本身,而是因为为了对抗幕后不成熟的技术而做出的艺术选择。应该投入更多资源,弥合艺术与工程之间的差距。
返回 "Memoji "和 "假阳性眉毛下垂 "页面
正如本篇文章开头提到的,每当 Memoji 试图映射我的微笑时,眉毛内角都会不必要地增加一些下垂的部分。同样,在各种类型的微笑中都会出现这种情况。
下图举例说明了数据质量与艺术之间的相互作用会对各种表达方式产生负面影响,并导致微笑时眉毛下垂等问题。
注:当然,可能有多种潜在原因,包括算法本身的问题;但是,本大纲是为了强调特定条件下的特定情况。
分解
皱鼻器和上唇器 是两个看起来相似的面部动作。
- 无论是在数据收集层面还是在数据标注层面,它们往往会相互混淆。
- 由于科技公司没有在数据质量方面进行适当的投资,它们通常不会培养能够准确识别或解释如何区分数据质量的员工。 皱鼻子者 和 戽斗.
- 数据收集和数据标注中的错误都没有被发现,人才无法发现跟踪错误。
艺术中的一种常见技巧是使用 戽斗 作为微笑的组合形状插件。
- 因为在微笑激烈时,唇角拉手的动作会将上唇抬起来,所以很多人都以为这个动作是同义词。 上唇提升器。 事情并非如此简单。
- 许多艺术家使用的是 戽斗 形合 唇角拉手 来打造一个坚强的笑容。 更多细节在这里。
- 撇开美观和准确性问题不谈,一个突出的问题依然存在:如果 戽斗 与 鼻子更皱了 当一个强烈的微笑开始时,它将激活 上唇提升器。 然后激活 皱鼻子者.因此,当有人微笑时,眉毛就会低下来。不好。
对数据质量重视不够。
对艺术的评价不够。
解决问题
最简单的解决办法是什么? 远离 FACS,向面部解剖学靠拢。 降低误报率的最简单解决方案是通过 皱鼻子者 和 戽斗 就是要尊重这些动作背后的肌肉特性。
从解剖学的角度来看,颚上提肌(levator palpebrae superioris)和颚下提肌(levator palpebrae superioris)都不属于上提肌。戽斗 肌肉)和睑上提肌(睑板前肌)。皱鼻子者 肌肉)使眉毛下垂。只有在 FACS 面部编码规则的范围内,才会将眉毛下垂与鼻子皱纹联系起来。
如果您能简单地
- 重新设计标签规则,将降眉器归类为不同于 皱鼻子者
- 重新设计您的混合形状,以举办 皱鼻子者 眉头不觉低垂