“养成系”AI诞生!谷歌DeepMind研发的这款程序可“像婴儿一样思考”
生物探索
2022-07-18 11:05

摘要:2016年3月,谷歌旗下DeepMind的人工智能AlphaGo团队以4:1首战击败世界围棋冠军李世石,引发全球网友关注。2022年,人工智能会下棋,甚至可以打败世界围棋冠军,似乎已是见怪不怪。近日,最强人工智能研发公司DeepMind以“深度思考”为原理,研发出“像婴儿一样思考”的AI程序。

近日,受到婴儿学习模式的启发,DeepMind的计算机科学家设计了一种人工智能(Artificial Intelligence,AI)的程序,相关结果以题为“Intuitive physics learning in a deep-learning model inspired by developmental psychology”发表在Nature Human Behavior上。该程序在物体行为的简单物理规则被打破时竟会表现惊讶,表现得像婴儿一样“思考学习”。该研究大大推进了AI在直觉感知领域的发展,使人工智能真的更像“人”了!

1658124937214843.png

图1 研究成果(图源:[1])

发育心理学家一直测试婴儿如何通过追踪注视来理解物体的运动。例如,当播放一段突然从视野中消失的球的视频时,婴儿注视着这一场景会瞪大眼睛表示惊讶,而研究人员就是通过测量婴儿注视特定方向的时间来量化这种惊讶。在此启发下,计算机科学家Luis Piloto和其研究团队开发了一种名为PLATO的AI系统,名字来源于Physics Learning through Auto-encoding and Tracking Objects(通过自动编码和跟踪对象进行物理学习)的首字母缩写。

PLATO仿真系统由两个模块组成:前馈感知模块(左)和循环动态预测器模块(右)。前馈感知模块中,通过编码器将图像转换为一组对象代码,通过解码器模块将对象代码解码成对应的图像。利用重建和原始图像之间的差异来训练编码器和解码器的参数。循环动态模块中,动态模块通过预先训练好的解码器对下一时刻的对象状态进行预测。

具体来说,研究者通过给PLATO重复观看涉及直观物理学的动画视频来训练它(图2),此动画视频由立方体和球等简单物体组成,展示的也多为一些简单动作,如球落到地上,球滚到其他物体后面又再次出现,很多球弹来弹去等。研究人员发现,在经过28小时的训练后,PLATO在看到一些没有意义的运动场景(如物体互相穿过却没有发生相互作用)时表现出了像婴儿一样的“惊讶”情绪。

1658124959488059.png

图2 训练PLATO模型的“自由形式”数据中的视频(图源:[1])

最重要的是,PLATO只观看了28小时便获得了以上的学习效果,实为惊人!此外,此次研究还有两个惊喜的发现:其一、该模型能够概括那些与集中视频训练不同的对象和事件;其二、通过在一个相对较小的视觉动画上集中训练,该模型能够成功地演示学习。

对此,美国西北大学教授Susan Hespos评价道,“与许多关键的研究发现一样,该研究可以成为人工智能和发展科学之间的协同机会。他们的工作正在突破日常经验可以和不可以解释智能的界限。这篇论文的结果表明,图灵可能是对的。”

Piloto表示,“PLATO系统所展现出来的效率就好比我们去看电影一般,我们仿佛随时可以预测接下来会发生什么。并且,随着电影的不断深入,预测会变得越来越准确”。

婴儿眼里的直观物理学是什么?

直观物理学是什么?我们可以简单地把它理解为“直觉”或者“常识”。比如往空中抛出一个物体,根据常识所知,物体不会飘浮在半空中,更不会穿过固体掉到地面上,这就是“直观物理学”带给人类的判断。直观物理学代表了人类了解世界的基础物理概念,也是思维中“常识”的关键组成部分。

在发展心理学领域中,直观物理学被分为5个方面的概念:

1. 连续性:物体不会从一个地方传送到另一个地方,而是在时间和空间中有一定的连续路径;
2. 对象持久性:物体在看不见时不会消失;
3. 固体性:物体不会相互渗透;
4. 不变性:对象的属性(如形状)不会更改;
5. 定向惯性:物体运动的路径与惯性原理一致。

以上就是我们容易理解和接受的“常识性”概念范畴,但是当事物的发展违背了我们的常识,例如本该落在桌子上的物体悬浮在半空中,我们便会对这样违背直观物理学的现象表现出惊讶,这种惊讶反应被称为违反期望(violation-of-expectation,VoE)效应,即使三个月大的婴儿也不例外。而如今我们的AI机器人在人为训练下,也可表现出VoE效应。

婴儿认知世界是与生俱来还是后天习得?

关于婴儿认知世界,一直存在“先天”与“后天”的争议。许多发展科学家认为这是“先天”的,也有一些学者更支持从无到有的“后天”理论。为了探究这个争论不休的议题,Piloto等人利用PLATO仿真系统,试图测试深度学习系统是否能够通过学习视觉动画,来获得对直观物理学的理解(图3)。如果“后天”的理论是正确的,那么智力发展可以通过处理大量经验和大量数据来进行锻炼。

1658124980785479.png

图3 PLATO应用感知模型和动力学模型预测物体运动(图源:[1])

这项研究则顺利地通过少到惊人的训练数据就让AI拥有了稳定的VoE效应。在面对超出5个直观物理学概念的情况发生时,PLATO仿真系统会显示出稳定的VoE效应。

研究人员发现,此现象可以解释一些直观物理学的概念,但是又与婴儿身上看到的现象并不完全适用。研究人员认为,虽然视觉动画的经验对智力发展有很重要的贡献,但不足以解释我们在婴儿身上看到的现象。换言之,智力发展并非全部依靠于“后天”的经验和数据。要形成完整的智力,还需要一些先天的认知。这项研究则介于“先天”和“后天”之间,保持着中立的中间立场。

研究团队将仿真建模和发展心理学中的关键问题融合起来,得到了意想不到的研究结果。目前,研究团队正在将VoE效应的研究扩展到神经生理学领域,这可能为后续研究开辟更多新的方向,也为AI的发展提供了更多的可能。

题图来源:Planète Robots,仅用于学术交流。

撰文|露娜
排版|文竞择

参考资料:
[1]Piloto LS, Weinstein A, Battaglia P, et al. Intuitive physics learning in a deep-learning model inspired by developmental psychology. Nat Hum Behav. 2022 Jul 11. doi: 10.1038/s41562-022-01394-8. Epub ahead of print. PMID: 35817932.