第20版:副刊

人民日报图文数据库(1946-2021)

人民日报 2024年11月08日 星期五

返回目录  放大缩小全文复制   下一篇

具身智能——

人工智能与机器人发展的重要推力(开卷知新)

张 钹 《 人民日报 》( 2024年11月08日   第 20 版)

  具身智能是指一种思想或者理论。它强调认知受智能体的感知与动作的影响,主张智能或智能行为来自智能体身体与周围环境的交互,而不仅仅是大脑的功能。这种思想与建立在笛卡尔身心二元论基础上的离身智能不同,后者没有考虑大脑与身体之间的联系。具身智能理论对认知科学、心理学、人类学、艺术等都产生了深刻的影响,由此诞生了具身认知、具身心理学等分支学科。当前,具身智能理论深入到大众关注的人工智能、机器人技术等领域,并产生重大影响。

  推动人工智能迈向更高水平的通用人工智能

  早期人工智能研究者认为,机器可以通过对符号的操作实现对人类思考(理性行为)的模拟,即让机器像人类那样思考,无需考虑身体和环境。他们把人工智能定义为模拟人类的智能行为,除了模拟思考之外,还包括感知、动作,以及情感与灵感等。由于他们认为思考和身体、环境是分离的,因此在模拟这些行为时,是各自独立进行,没有考虑行为之间的相互联系。人工智能的另一学派内在主义,主张人工智能应该模拟人类大脑的工作原理,我们通常称之为类脑计算。这个学派也没有考虑思考、感知与身体的关系。因此传统人工智能中的两大学派都属于离身智能。

  具身智能则认为人类的智能行为不仅依赖大脑的思考,还需要通过与物理环境的交互来进行学习和决策,最后通过感知将执行的结果反馈到大脑,形成闭环,构成一个智能体,这样才能真正实现模拟人类智能行为的目标。具身智能这种思想的提出,与传统人工智能不同,将推动人工智能向更高的水平——通用人工智能发展。

  人工智能的发展历史,经历过三个阶段。第一代人工智能提出以知识与经验为基础的推理模型,通过这一模型来模拟人类的思考。这一模型具有可解释性与可理解性的优点,但由于知识表示与获取的困难,该模型在应用和产业化上受到很大限制。第二代人工智能提出数据驱动的模型,通过基于大数据的机器学习,实现对人类感性和情感行为的模拟。由于模型的图像、语音等输入数据来自客观世界,因此具有很大的应用潜力,但由于模型本身存在不安全、不可靠、不可信(不可解释)、不可控和不易推广等缺陷,因此应用范围有限。虽然科学家在这期间也进行过模拟人类动作,比如手的操作与脚的步行等研究,但没有将这些研究与思考、感知等其他方面联系起来。总之,这两代人工智能都有很大的局限性,而且只针对特定领域、利用特定模型去解决特定任务。

  2020年大语言模型的出现,把人工智能推向新的发展阶段——第三代人工智能。大语言模型具有强大的语言生成能力,使机器能够在开放领域下实现与人类的自由交互,这表明机器已经完全掌握了人类的语言。此事意义重大。正如哲学家维特根斯坦所言:“我的语言界限,就是我的世界界限。”机器一旦掌握了人类的语言,也就在某种程度上理解了人类的世界。大语言模型向通用人工智能迈出了关键一步。

  尽管人工智能在语言生成上取得成功,在许多其他任务上还不能实现领域的通用性。比如医疗诊断,目前我们还没有开发出适用于各种疾病的计算机医疗诊断系统。另外,大语言模型只会说(生成语言),不会干(行动)。还有大量的任务,特别是复杂的任务,人工智能目前还无法完成。我们离真正的通用人工智能仍有一定距离,其原因就在于,传统人工智能对人类(大脑)的思考、感知与动作等方面的模拟是相互分开的,而且与环境隔离。具身智能则强调物理身体、环境感知与反馈的重要性,并通过它们实现与外部世界的交互。这正好弥补了传统人工智能的不足,使机器通过与环境的反复交互,逐渐学习适应环境并优化其决策和行动,不断迭代,完成更多、更复杂的任务,这就是新的学习范式——强化学习。由此可见,具身智能将使人工智能在更广泛的环境下,完成更多的任务,向通用人工智能迈进。

  推动机器人领域三方面的技术进步

  机器人的研究远在人工智能诞生之前。1954年,科学家发明数字控制可编程的机械臂,为现代工业机器人打下基础,也预示着现代机器人的真正诞生。在人工智能的发展过程中,虽然也将模仿人类动作纳入研究范围,但由于当时研究的重点是思考与感知,动作(身体)并没有受到很大关注。后来,机器人研究慢慢形成一个新领域——机器人学,与人工智能中的动作研究同时存在。机器人学研究的范围更宽,也更多关注技术、实际应用和产业化。1986年,移动机器人的先驱罗德尼·布鲁克斯提出了行为主义机器人学的主张,他认为传统的符号主义人工智能过于依赖复杂的推理系统,忽视了身体与环境的互动对智能行为的关键性贡献。可以说,这是在机器人领域首次提出具身智能思想。

  总的来看,具身智能推动了机器人领域三方面的技术进步。

  其一是推动机器人技术从单一感知(如视觉或触觉)向多模态感知发展。自动驾驶汽车需要在各种气候条件和复杂环境下行驶,全天候的环境感知极为重要。目前除了利用单一的摄像机之外,人们更多地考虑多传感器融合,即除摄像机之外,还要综合利用激光扫描仪、雷达、声呐、卫星定位等不同传感器,以保证感知的可靠性。同样,对机械手来讲,也需要利用触觉、力觉、力矩觉等多传感器的融合,以便在复杂环境下实现复杂操作,比如,装配、抢险救灾、排雷等。

  其二是推动机器人技术更加关注软件与硬件的高度整合。为了适应不同工作任务的需求,我们需要设计不同类型的机器人,如为家庭服务的人形机器人,拥有灵巧双手的装配机器人,拥有特殊功效的仿生机器人等。不同类型的机器人需要不同的控制技术,也会导致不同的学习和感知方式,这反过来又影响机器人形态的设计。这些都属于机器人软硬件协同的问题。

  其三,具身智能中的智能体概念对机器人技术也将产生重要影响。根据智能体这一概念,机器人将思考、感知和动作连为一体,既可以在数字世界中也可以在物理世界中完成任务,利用数字世界又可以对物理世界进行仿真,这些对推动机器人的发展意义重大。比如,无人车的实验如果在物理世界中进行,就要受到气候条件、突发事件等诸多因素限制,利用仿真模拟则会大大提高效率,节省时间与费用。利用智能体理论,我们可以让机器人相互之间进行博弈,实现机器的自我进化(迭代),使机器人的性能不断提高。

  (作者为中国科学院院士、清华大学教授)  

           

  推荐读物

  《人工智能导论》:林尧瑞、马少平编著;清华大学出版社出版。

  《可解释人工智能导论》:杨强、范力欣等著;电子工业出版社出版。

  《具身智能导论》:刘华平、郭迪等编著;高等教育出版社出版。

  版式设计:蔡华伟

版权声明

《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。

人民日报手机报

移动用户 发送RMRB10658000

联通用户 发送RMRB10655111

  • ios版

  • android版

  • 微信小程序