2023年3月,科技部会同国家自然科学基金委员会启动“人工智能驱动的科学研究”(AI for Science)专项部署工作,提出推进面向重大科学问题的人工智能模型和算法创新,发展一批针对典型科研领域的“人工智能驱动的科学研究”专用平台。同年5月,百度智能云与上海交通大学合作,启动建设AI for Science科学数据开源开放平台,将大模型和科学研究紧密结合,助力推动前沿科技创新,构建人工智能支撑基础和前沿科学研究的新范式。
“科学技术是第一生产力”。AI for Science旨在通过生成式人工智能推动科学研究方法的变革,进一步形成科研新范式,利用人工智能提升社会生产力,以科技创新驱动高质量发展,形成活跃、先进、高效、绿色的工作流程,推动技术革新和产业升级。
百度智能云与上海交通大学合作,以百度自主研发的文心大模型为基础,搭载大模型、人工智能中台、数据中台、隐私计算平台、百度百舸·AI异构计算平台等以百度智能云为依托的“全家桶”解决方案,构建了AI for Science科学数据开源开放平台,实现生成式人工智能与科研场景的结合。
AI for Science科学数据开源开放平台是百度智能云综合能力的体现,在算力层,依托百度百舸·AI异构计算平台端到端优化的异构算力底座能力,为上海交通大学科研人员提供训练、推理网络的算力优化配置,实现训练和推理加速,提高研究效率。结合数据中台与人工智能中台,实现对科研数据、模型开发和纳管等的综合管理。同时,搭载隐私计算平台,实现科学数据可信共享,为多学科数据的建模、计算提供便利。
以化学合成领域为例,AI for Science科学数据开源开放平台可加速从分子设计、反应设计到条件生成、反应检验等化学合成全链条,使潜在功能性分子如药物分子及其合成方案设计时长,从传统方法的几个月提速到几十分钟,帮助科研人员节省研究时间、提高实验效率。此外,平台在流体模拟和智慧司法领域也形成了具有行业影响力的创新应用,助力科研人员在大模型领域实现协同创新。
目前,AI for Science科学数据开源开放平台已在上海交通大学化学、流体等跨学科科研场景中得到应用,提供全面、高效和开放的“生成式人工智能+科研”一站式解决方案和平台化智慧科研模式。平台强大的计算、整合和分析能力,以及开放性、易用性和可扩展性,助力科研人员更高效地投入创新工作,更快速地适应科学研究范式的变革。
上海交通大学作为我国历史悠久、享誉海内外的高等学府,自建校以来一直紧跟时代技术发展趋势,科学研究与科技创新水平不断提高。在AI for Science科学数据开源开放平台的支持下,2023年7月,上海交通大学研制并推出白玉兰科学大模型1.0版,依托上海白玉兰开源开放研究院正式开源发布。2023年12月,上海交通大学与百度智能云共同发布白玉兰科学大模型2.0,在化学合成、司法领域形成“化学合成2.0”和“法律开源”创新大模型应用并开源开放。
随着白玉兰科学大模型等应用落地,AI for Science科学数据开源开放平台形成了基于生成式人工智能赋能科研的方法模式,提供了人工智能与科研场景相结合的创新示范。面向未来,该平台将在探索、融合、反馈的过程中不断成长,致力于为科学研究的全面智能化构建坚实的基础,推动国内生成式人工智能技术与科学研究相互结合、交叉演进的业态迈向国际领先水平。
AI for Science科学数据开源开放平台有利于拓展科学思维,提升实验技能,加速科学发现,培育未来产业,推动新质生产力加快形成。未来,百度智能云与上海交通大学将围绕分子合成、药物研发、基因研究、流体力学、新材料研发等重点领域科研需求展开合作,促进人工智能与科学研究深度融合,推动资源开放汇聚,提升创新能力,探索科学前沿。
数据来源:百度