“人工智能+”行动已上升为国家战略,成为培育新质生产力、驱动产业升级的关键引擎。
当前,人工智能正在经历从“通用能力”向“专业赋能”演进的关键阶段。然而,在推进过程中,通用大模型由于缺乏对特定产业场景的深度理解,难以满足复杂、专业的行业需求,制约了“人工智能+”的实际效能。
破局的关键,在于大力发展基于高质量行业数据的垂直领域大模型,将其打造为赋能千行百业的“行业专才”与新型基础设施。
调研显示,我国在推动行业大模型发展过程中,面临高质量专业数据供给不足、数据治理规则不健全、数据共享机制不畅等突出矛盾。
在化工、材料、生物医药等高度依赖专业数据的领域,我国长期依赖购买国外商业数据库,自身缺乏系统性的数据积累与标准化体系建设。行业内部,企业间数据壁垒高筑,缺乏互利共享的有效机制。例如,人工智能制药企业难以获取医院的真实世界诊疗数据,智能制造企业难以共享工艺参数数据,导致高价值数据分散、封闭,难以形成规模化、标准化的训练资源。
行业数据的系统性建设与创新性治理,已成为“人工智能+”能否走深走实的关键变量。为此,建议将行业数据资源建设提升到与技术创新、硬件投入同等重要的战略高度,通过分类施策、机制创新与规则完善,为“人工智能+”夯实数据基石。
具体而言,建议优先选取生物医药、高端材料、精细化工、智能制造等数据价值密度高、智能化需求迫切的行业,开展“人工智能+行业数据”试点。针对每个试点行业,研究制定“行业高质量数据发展指南”,明确该领域高质量数据的定义标准、技术规范、关键缺失清单及阶段性建设目标。通过试点先行,形成可复制、可推广的经验,逐步构建覆盖重点行业的专业数据资源体系。(作者系全国政协委员、九三学社中央常委、中国科学院院士)
