第20版:副刊

本版新闻

人民日报 2024年11月08日星期五

　　具身智能是指一种思想或者理论。它强调认知受智能体的感知与动作的影响，主张智能或智能行为来自智能体身体与周围环境的交互，而不仅仅是大脑的功能。这种思想与建立在笛卡尔身心二元论基础上的离身智能不同，后者没有考虑大脑与身体之间的联系。具身智能理论对认知科学、心理学、人类学、艺术等都产生了深刻的影响，由此诞生了具身认知、具身心理学等分支学科。当前，具身智能理论深入到大众关注的人工智能、机器人技术等领域，并产生重大影响。

　　推动人工智能迈向更高水平的通用人工智能

　　早期人工智能研究者认为，机器可以通过对符号的操作实现对人类思考（理性行为）的模拟，即让机器像人类那样思考，无需考虑身体和环境。他们把人工智能定义为模拟人类的智能行为，除了模拟思考之外，还包括感知、动作，以及情感与灵感等。由于他们认为思考和身体、环境是分离的，因此在模拟这些行为时，是各自独立进行，没有考虑行为之间的相互联系。人工智能的另一学派内在主义，主张人工智能应该模拟人类大脑的工作原理，我们通常称之为类脑计算。这个学派也没有考虑思考、感知与身体的关系。因此传统人工智能中的两大学派都属于离身智能。

　　具身智能则认为人类的智能行为不仅依赖大脑的思考，还需要通过与物理环境的交互来进行学习和决策，最后通过感知将执行的结果反馈到大脑，形成闭环，构成一个智能体，这样才能真正实现模拟人类智能行为的目标。具身智能这种思想的提出，与传统人工智能不同，将推动人工智能向更高的水平——通用人工智能发展。

　　人工智能的发展历史，经历过三个阶段。第一代人工智能提出以知识与经验为基础的推理模型，通过这一模型来模拟人类的思考。这一模型具有可解释性与可理解性的优点，但由于知识表示与获取的困难，该模型在应用和产业化上受到很大限制。第二代人工智能提出数据驱动的模型，通过基于大数据的机器学习，实现对人类感性和情感行为的模拟。由于模型的图像、语音等输入数据来自客观世界，因此具有很大的应用潜力，但由于模型本身存在不安全、不可靠、不可信（不可解释）、不可控和不易推广等缺陷，因此应用范围有限。虽然科学家在这期间也进行过模拟人类动作，比如手的操作与脚的步行等研究，但没有将这些研究与思考、感知等其他方面联系起来。总之，这两代人工智能都有很大的局限性，而且只针对特定领域、利用特定模型去解决特定任务。

　　2020年大语言模型的出现，把人工智能推向新的发展阶段——第三代人工智能。大语言模型具有强大的语言生成能力，使机器能够在开放领域下实现与人类的自由交互，这表明机器已经完全掌握了人类的语言。此事意义重大。正如哲学家维特根斯坦所言：“我的语言界限，就是我的世界界限。”机器一旦掌握了人类的语言，也就在某种程度上理解了人类的世界。大语言模型向通用人工智能迈出了关键一步。

　　尽管人工智能在语言生成上取得成功，在许多其他任务上还不能实现领域的通用性。比如医疗诊断，目前我们还没有开发出适用于各种疾病的计算机医疗诊断系统。另外，大语言模型只会说（生成语言），不会干（行动）。还有大量的任务，特别是复杂的任务，人工智能目前还无法完成。我们离真正的通用人工智能仍有一定距离，其原因就在于，传统人工智能对人类（大脑）的思考、感知与动作等方面的模拟是相互分开的，而且与环境隔离。具身智能则强调物理身体、环境感知与反馈的重要性，并通过它们实现与外部世界的交互。这正好弥补了传统人工智能的不足，使机器通过与环境的反复交互，逐渐学习适应环境并优化其决策和行动，不断迭代，完成更多、更复杂的任务，这就是新的学习范式——强化学习。由此可见，具身智能将使人工智能在更广泛的环境下，完成更多的任务，向通用人工智能迈进。

　　推动机器人领域三方面的技术进步

　　机器人的研究远在人工智能诞生之前。1954年，科学家发明数字控制可编程的机械臂，为现代工业机器人打下基础，也预示着现代机器人的真正诞生。在人工智能的发展过程中，虽然也将模仿人类动作纳入研究范围，但由于当时研究的重点是思考与感知，动作（身体）并没有受到很大关注。后来，机器人研究慢慢形成一个新领域——机器人学，与人工智能中的动作研究同时存在。机器人学研究的范围更宽，也更多关注技术、实际应用和产业化。1986年，移动机器人的先驱罗德尼·布鲁克斯提出了行为主义机器人学的主张，他认为传统的符号主义人工智能过于依赖复杂的推理系统，忽视了身体与环境的互动对智能行为的关键性贡献。可以说，这是在机器人领域首次提出具身智能思想。

　　总的来看，具身智能推动了机器人领域三方面的技术进步。

　　其一是推动机器人技术从单一感知（如视觉或触觉）向多模态感知发展。自动驾驶汽车需要在各种气候条件和复杂环境下行驶，全天候的环境感知极为重要。目前除了利用单一的摄像机之外，人们更多地考虑多传感器融合，即除摄像机之外，还要综合利用激光扫描仪、雷达、声呐、卫星定位等不同传感器，以保证感知的可靠性。同样，对机械手来讲，也需要利用触觉、力觉、力矩觉等多传感器的融合，以便在复杂环境下实现复杂操作，比如，装配、抢险救灾、排雷等。

　　其二是推动机器人技术更加关注软件与硬件的高度整合。为了适应不同工作任务的需求，我们需要设计不同类型的机器人，如为家庭服务的人形机器人，拥有灵巧双手的装配机器人，拥有特殊功效的仿生机器人等。不同类型的机器人需要不同的控制技术，也会导致不同的学习和感知方式，这反过来又影响机器人形态的设计。这些都属于机器人软硬件协同的问题。

　　其三，具身智能中的智能体概念对机器人技术也将产生重要影响。根据智能体这一概念，机器人将思考、感知和动作连为一体，既可以在数字世界中也可以在物理世界中完成任务，利用数字世界又可以对物理世界进行仿真，这些对推动机器人的发展意义重大。比如，无人车的实验如果在物理世界中进行，就要受到气候条件、突发事件等诸多因素限制，利用仿真模拟则会大大提高效率，节省时间与费用。利用智能体理论，我们可以让机器人相互之间进行博弈，实现机器的自我进化（迭代），使机器人的性能不断提高。

　　（作者为中国科学院院士、清华大学教授）

　　推荐读物

　　《人工智能导论》：林尧瑞、马少平编著；清华大学出版社出版。

　　《可解释人工智能导论》：杨强、范力欣等著；电子工业出版社出版。

　　《具身智能导论》：刘华平、郭迪等编著；高等教育出版社出版。

　　版式设计：蔡华伟

具身智能——

人工智能与机器人发展的重要推力（开卷知新）

张钹《人民日报》（ 2024年11月08日第 20 版）