
婴儿对物理世界的运作存在某种原则性期望。若AI系统被设计为具备类似的认知基础,会产生何种结果?
在观点纷争的世界中,我们仍可基于物理世界的基本法则达成共识:当一支笔被展示后隐藏于背后,即便它从视野中消失,我们仍确信其客观存在。这种对客体永久性(object permanence)的普遍认知,甚至是两个月大的婴儿亦具备的能力,构成了人类理解现实的基石。然而,科学家对其形成机制仍存未解之谜。
普林斯顿大学Luis Piloto团队的最新研究(本人正为《自然·人类行为》评审该成果)在弥合这一认知鸿沟中取得进展。研究者构建了一个基于自主探索的深度学习模型,通过模拟婴儿的具身学习方式,使AI系统获得对物理对象的理解能力。该模型采用“发育启发的学习框架” ——即从原始感知数据中自发归纳物理规律,而非依赖预设规则。
此项工作为人类思维建模提供了新路径:通过借鉴婴儿的认知发展假设,构建更贴近人类本质的计算机模型。
● ● ●
基于发育启发的AI学习框架突破
传统AI模型通常从零基础初始状态出发,通过海量数据训练构建知识体系。然而,婴儿行为研究表明:人类认知发展并非始于空白,而是基于先天结构化的核心假设展开学习。
关键差异举证:
●婴儿具备客体永久性(object permanence)先验认知——当物体被遮挡时,仍确信其持续存在;
●此类假设构成认知发展的约束性起点,驱动知识向精细化演进。
Piloto团队的突破性发现在于:通过模拟婴儿的先天假设驱动学习机制,其构建的深度学习系统性能显著超越传统数据驱动模型(p<0.01)。该模型证实——融合发育约束的架构设计可提升AI的物理推理效率与泛化能力。
● ● ●
立方体滑动和球弹到墙上
研究人员对两种人工智能模型进行了性能对比。第一种是“空白模型”(baseline model),该模型仅被输入一系列描绘物体运动的视觉动画以供学习。这些动画包含多种情景,例如方块沿斜坡下滑,或球体撞击墙壁后反弹等动作序列。
该模型首先从这些动画中学习潜在的运动模式,随后在新物体的动画上接受测试,评估其预测物体未来行为的能力。研究团队将空白模型的表现与第二种模型——一种内置了“有原则的期望”(principled expectations)的模型——进行比较。这些原则的设计灵感源于婴儿对物体基本行为和相互作用的先天预期。
例如,婴儿普遍预期物体不应相互穿透(物体实体性原则)。当目睹违反此预期的“魔术”场景时(如一个物体穿过另一个),婴儿能敏锐地察觉到异常,这表现在他们注视此类意外结果的时间显著长于符合预期的事件。
此外,婴儿还预期物体不会凭空消失或突然出现(物体持久性原则)。这类违反同样会引起他们更长时间的注视(即“违背预期范式”下的反应)。
Piloto及其同事的研究发现:虽然从零开始训练的空白深度学习模型表现尚可,但受婴儿核心认知启发、采用基于物体为中心编码(object-centric encoding)的模型表现显著更优。后者不仅能更精确地预测物体的运动轨迹,更成功地将习得的原则泛化到全新的动画场景中,并且展现出更强的学习效率——仅需相当于28小时的训练数据即可达到良好性能。
● ● ●
与生俱来的理解?
Piloto团队的这项研究为理解人类认知中“先天与后天”这个古老争论提供了关键洞见——时间和经验固然至关重要,但它们并非塑造认知的全部因素。
与此同时,该发现重新划定了感知数据在人工智能系统知识获取过程中的作用边界。它有力地证明:探究婴儿的先天认知机制,能够指引我们开发更接近人类智能的人工智能系统。
「本文仅代表作者个人观点,不代表文星Jack立场」