第08版:网络世界

人民日报海外版 2023年12月22日 星期五

返回目录   放大缩小全文复制   下一篇

技术创新快 应用渗透强 国际竞争激烈

千行百业加速拥抱大模型(AI前沿观察)

潘旭涛 陈斯达 《 人民日报海外版 》( 2023年12月22日   第 08 版)

  在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。
  新华社记者 陈泽国摄

  观众在2023杭州云栖大会上参观AI大模型相关应用。
  龙 巍摄(人民图片)

  近日,《联合国气候变化框架公约》第二十八次缔约方大会(COP28)在阿联酋迪拜举行。大会期间,中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型,对气象进行预报的时间范围长、精度高。

  当前,中国国产大模型进入高速发展期,千行百业加速拥抱大模型。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,涌现出一批具有行业影响力的预训练大模型。

  工业和信息化部新闻发言人陶青表示:“以大模型为代表的人工智能发展呈现出技术创新快、应用渗透强、国际竞争激烈等特点,深刻改变制造业生产模式和经济形态,展现出强大的赋能效应。”

  垂直大模型密集“上新”

  专家认为,大模型的长期价值将通过行业应用实现。随着技术不断迭代更新,大模型的应用场景日益广泛。

  在北京经济技术开发区(北京亦庄),不少驾车的市民发现,遇到红灯的次数明显变少了,经常是“一路绿灯”。这背后,是全域信控与交通大模型在发挥作用。

  据了解,北京亦庄联手百度,将路侧感知数据、互联网数据等多源时空数据进行融合。在此基础上,利用交通大模型研判拥堵发生的可能性,叠加仿真推演,生成全域信控方案,并自动优化信号灯配时方案,由“车看灯行”变为“灯随车动”。据测算,北京亦庄布局全域信控后,路口的平均通过时间缩短28%。

  从交通到文旅,从教育到医疗,近期,垂直领域的各类大模型密集“上新”。相较于通用大模型,垂直大模型具有更强的专业性,能够更好地解决特定领域的问题和提供更加精准的服务。

  携程集团发布的旅游行业垂直大模型“携程问道”,支持自然语言交互,可以辅助用户进行酒店、景点预定以及行程规划决策等。

  科大讯飞发布的“讯飞晓医”APP,基于讯飞星火医疗大模型,可实现健康自查、体检报告解读、健康档案管理等功能,为用户提供健康咨询。

  南京农业大学科研团队发布的古籍大语言模型,能够实现词法分析、信息抽取、智能作诗等功能,有望应用推广到古籍整理、数字文娱等领域。

  数据显示,截至今年10月,中国拥有10亿参数规模以上大模型的厂商及高校院所超过250家,垂直行业应用成为大模型产业落地的关键赛道。上海财经大学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。

  “当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展路线逐渐清晰。”中国工程院院士、湘江实验室主任陈晓红表示,大模型技术与实体经济加速融合,应用场景十分广泛。

  数据“燃料”加快共建共享

  数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。

  今年7月,2023世界人工智能大会发起成立了中国大模型语料数据联盟。8月,上海人工智能实验室宣布,联合中国大模型语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB,包含超5亿个文本、2200万个图文交错文档、1000个影像视频。

  在11月举行的2023人工智能计算大会上,智源研究院联合阿里云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。

  数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》提出:“依托上海数据交易所建立语料数据交易板块。”当前,上海数据交易所挂牌的语料数据产品包含文本、音频、图像等多模态,覆盖金融、交通、医疗等领域。上海数据交易所总经理汤奇峰表示:“语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素、推动语料库建设。”

  建设智算中心增加算力供给

  大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型发展路上的必答题。

  电信运营商、互联网企业等积极投入智算中心建设之中。去年至今,重庆移动智算中心、阿里云张北超级智算中心等陆续投入运营。今年以来,中国联通长三角(芜湖)智算中心、河北石家庄智算中心等相继启动建设。

  当前,各地加速推动算力基础设施建设,提升算力供给能力。《北京市促进通用人工智能创新发展的若干措施》提出,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。《河南省重大新型基础设施建设提速行动方案(2023—2025年)》提出,实施高性能算力提升工程,加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网。

  在“东数西算”战略背景下,西部智算中心建设迎来发展机遇期。11月30日,青藏高原第一座智算中心——青海昆仑人工智能算力中心正式揭牌,依托三江源国家大数据基地,实现算力资源的托管运营。12月7日,宁夏回族自治区首个大规模集群智算中心建设项目签约,该中心以国产全功能GPU为底座,为大模型训练与推理、3D图形渲染等提供算力支撑。

  今年10月,工业和信息化部等6部门印发《算力基础设施高质量发展行动计划》,提出到2025年,算力规模超过300EFLOPS(EFLOPS是指每秒百亿亿次浮点运算次数),智能算力占比达到35%。京津冀、长三角、粤港澳大湾区、成渝等节点面向重大区域发展战略实施需要,有序建设算力设施;贵州、内蒙古、甘肃、宁夏等节点推进数据中心集群建设的同时,着力提升算力设施利用效率,促进东西部高效互补和协同联动。

  “算力尤其是智能算力已经成为驱动大模型进化的核心引擎。智算力就是创新力,已经成为产业共识。”浪潮信息董事长彭震表示,应大力发展普适普惠的智算中心,使智能算力成为城市的公共基础资源,用户可以选择自建算力集群,也可以采用智算中心提供的算力服务来完成大模型开发。