在日前法国巴黎举行的人工智能行动峰会上,中国人工智能大模型深度求索(DeepSeek)备受关注。
DeepSeek之所以“走红”国际,主要是因为它验证了一种低成本、高效率的大模型开发路径。其核心价值在于通过算法创新突破算力瓶颈,成功打破了“算力崇拜”“制程优势等于技术霸权”的固有观念,大大增强了业界对于开源道路探索的信心。同时,DeepSeek鼓励更多AI企业和科研机构回归基础研究,推动全球AI行业向更加多元化的方向发展。
从AI技术层面来看,其显著优势体现在几个方面:一是在基座模型和推理模型上,DeepSeek通过硬件资源、模型架构和算法的协同设计与优化,打造了性能接近全球领先水平的基座模型。其创新推理模型显著降低了推理时的硬件需求,使模型能够更好地适应不同的任务和使用场景。二是在训练和硬件设施上,DeepSeek训练效率显著提升,这些技术优化使得模型在有限资源下能够快速迭代,提升研发效率。三是在高质量数据获取和处理上,DeepSeek通过知识蒸馏和精细的数据清洗与合成等方式,显著提升了模型性能。
DeepSeek的成功,是中国AI科创“新势力”崛起的一个缩影。当前,中国在计算机视觉、中文自然语言处理、自动驾驶与智能交通、通用智能机器人等领域已具备较强国际竞争力。如今日渐家喻户晓的杭州“六小龙”以及拥有领先计算机视觉技术的商汤科技、激光雷达领域堪当“龙头”的禾赛科技、开启人形机器人商业化量产的智元机器人等扎根上海的企业,都展现出强大的创新动能。
中国人工智能创新技术持续出现,得益于多方面因素支撑。一方面,中国前瞻性部署以及不断完善的顶层设计和产业布局,为推动人工智能技术和产业蓬勃发展提供重要保障。另一方面,庞大的互联网用户群体为中国技术创新提供全球领先的数据资源,超过10亿的互联网用户创造了海量用户行为数据,不仅为大模型的训练优化提供基础,也为多元化的应用场景落地提供肥沃土壤。此外,中国人工智能高水平教育全面开展、高素质人才迅速回流,为中国AI创新提供源源不断的人才支持。国内顶尖高校和科研机构大力推进人工智能学科建设,培养大量AI青年才俊,政府、高校、企业多方主体共建人工智能联合实验室、新型研发机构等创新主体,进一步推动产学研用一体化发展。另外,国产深度学习框架以及开源生态的积累和沉淀正在加速国产AI技术实现自主可控的进程。
当前,从全球范围来看,美国和中国无疑是AI发展的两大主力。得益于强大的科研基础、人才资源聚集和资本市场支持,美国依旧处于技术创新的领先地位,特别是在大模型和高端芯片方面。中国凭借丰富的数据资源、多样化应用场景,在智能制造、智慧城市、智慧金融等应用落地以及计算机视觉、语音识别等基础研究方面取得了一定进展。近年来,中国在人工智能技术创新方面取得显著突破,尤其是像DeepSeek这样的国内AI初创企业,提高了中国企业在基础大模型领域的话语权,标志着中国人工智能产业逐渐从“规模追赶”迈向“效率超越”。
以DeepSeek为代表的AI初创型企业的“成功秘诀”,也再次提示一个AI领域发展的独特规律:在要求“深度求索”的AI领域,不设包袱、极致热情、鼓励探索的创新企业会更容易成为“黑马”。注重创新驱动的发展模式、鼓励员工自主探索和动态协作等AI创新发展的经验,也将鼓舞更多科技创新企业突破发展瓶颈、在创新之路上马不停蹄,共同探索前沿科技的“深海区”。
(作者为上海交通大学上海人工智能研究院院长、联合国工业发展组织全球工业人工智能联盟卓越中心总干事,本报记者高乔整理)