1月16日,由成都传媒产业集团旗下红星传媒联合中国人工智能产业发展联盟数据委员会主办的第三届“大模型 大未来”人工智能大模型基准测试发展大会暨人工智能高质量数据集炼金工坊生态行在成都高新区举办。来自清华大学、天津大学、中国信通院人工智能研究所等知名高校和研究机构的专家学者进行了主题分享,现场汇聚近百家企业代表,共计200余名与会者交流了人工智能领域的前沿科技并探讨场景落地路径。
本次大会由四川省科学技术厅指导,中国信通院人工智能研究所、四川省大数据发展研究会等单位协办。
本次大会发布多项成果:新增全国高校大模型创新发展联盟第二批成员;公布15个“‘巢燧’大模型创新应用案例”;发布教育场景大模型核心价值观对齐能力评测白皮书。同时,在会上正式开启“人工智能高质量数据集炼金工坊生态行”系列活动。
锚定人工智能赛道
“1234”解码发展底气
四川省科学技术厅党组书记、厅长路松明为参会嘉宾系统阐述了四川人工智能发展现状与优势,欢迎产业链上的各类企业来川发展。他用“一二三四”来概括了四川发展人工智能的现状和底气。
“一”是全省一号创新工程。近年四川省累计投入3.7亿余元财政资金,研制出全国领先的浸没式液冷服务器、亮相“九三”阅兵的机器狼等标志性成果;
“二”是产业规模连上两个千亿级台阶。通过建立人工智能产业协同推进机制,布局成都、绵阳主承载地及11个协同发展地,产业营收保持30%以上增速,预计2025年产业营收超2000亿元;
“三”是3年投入12个亿。印发实施《四川省促进人工智能产业链发展若干政策》,省级层面整合12亿元财政资金,支持企业在人工智能领域的科技攻关、人才引育、场景应用、算力使用和数据集建设等,为企业发展给予全方位的政策资源保障;
“四”是算力网络运载力全国第四。目前全省可用算力规模30E(FP16),高质量数据集基本覆盖工业、金融、医疗、交通、教育等重点领域,省内城市间时延低于3毫秒,成渝集群互联时延低于5毫秒。
成都传媒集团董事长、成都传媒产业集团党委书记、董事长母涛在致辞中表示,集团推动的大模型大会举办两年以来,在政府主管部门、科研机构、头部企业的大力支持下,已从单一的“技术分享平台”升级为集交流、合作、转化为一体的“大模型生态构建平台”,这一活动将持续下去,当好人工智能产业的推进器。
作为成都新闻舆论主阵地、文创产业主引擎,成都传媒集团正在牵头筹建成都文化大数据公司,全面推进AI技术应用,推动集团加速向“智媒体集团”转型升级。
三项重要成果落地
大会从规模扩张转向生态深耕
作为已成功连续举办三届的人工智能领域IP活动,本次大会凝聚行业集体智慧,落地了三项重要成果。
① 高校大模型联盟扩容,打通产学研协同链路。
现场,全国高校大模型创新发展联盟完成第二批成员授牌,新增海光信息、中国移动、科大讯飞、海天瑞声、东方国信等核心企业成员。该联盟由红星新闻联合北京大学、天津大学、上海交通大学等10余所高校于2024年发起,致力于为大模型产业发展提供技术赋能和人才培养。此次新联盟成员的加入,覆盖基础模型、算力、数据及产业应用领域,将进一步助推人工智能技术与产业的深度互通与转化。
② 15 个标杆案例发布,彰显行业应用深度。
围绕大模型技术的创新和应用落地,15个大模型创新应用案例入围,覆盖教育、金融、医疗、能源、农业等关键领域,为行业发展提供了更多的优秀案例参考。
③ 教育场景白皮书发布,为行业标准制定提供参考。
大会现场发布《教育场景大模型核心价值观对齐能力评测白皮书》。针对大模型大规模应用后生成内容的价值导向问题,白皮书对多款具有代表性的大模型进行了对比分析,总结了当前大模型在价值对齐能力方面的总体水平、差异特征与普遍短板,为模型研发优化、行业治理体系构建以及未来标准制定提供重要的参考依据。
随着这些重要成果的落地,人工智能大模型基准测试发展大会逐步从关注技术前沿向聚焦应用场景延伸,为人工智能产业高质量发展构建可落地的路径和生态合作平台。
行业专家建言献策
锚定技术前沿与行业痛点
本次大会汇聚了多位行业权威专家,与来自中国移动、中国电信、百度、科大讯飞、海光信息、海天瑞声、东方国信、四川长虹等近百家企业代表。大会围绕生成式人工智能与大模型技术的前沿进展、应用创新及未来趋势,展开了战略研讨与深度对话。
欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松将“AI进入深度学习时代”和“AI进入预训练模型和大模型时代”视为人工智能技术发展的两次里程碑,他指出:大模型不是“灵丹妙药”,需与专业领域“融合互促”。孙茂松强调,人工智能应用要“致广大而尽精微”:既要把握AI宏观潜力,又需在具体场景做到精益求精。他指出,大模型在文本、代码、多模态领域进展迅速,但在具身智能和空间智能方面仍面临挑战,“人工智能不是魔法,而是需要专业领域深度合作才能发挥最大价值”。
天津大学“语言智能与技术”中外联合研究中心主任熊德意聚焦《教育场景大模型核心价值观对齐能力评测》,指出大模型在教育领域的应用已覆盖智能教学辅助、个性化学习指导等多元场景,建议应针对性开展面向教育场景的价值观对齐专项训练,重点提升大模型在伦理关系、人际交往及职业操守维度的价值对齐能力,以及提升教育场景适配能力。
开放原子开源基金会研发部部长李少辉在发言中分享了几组数据:中国AI论文数量全球领先,但重要专利、核心论文规模与美国存在显著差距;在开源领域,中国开发者数量居全球第四,贡献排名第三,但模型、智能体和数据集领域仍落后。希望通过基金会搭建的开源平台,链接行业企业需求,共同推动产业技术的发展。
跨维(深圳)智能科技有限公司人形事业部副总经理陈泓则是聚焦大模型与具身智能的融合,结合一系列具体案例展现其在汽车、家电、物流等多领域广阔的应用前景。
聚焦高质量数据集建设
炼金工坊搭建生态合作桥梁
数据是人工智能发展的基础,高质量数据集不仅能为模型训练提供丰富、准确且具有代表性的数据资源,更是决定模型质量的关键。
如何建设高质量数据集?中国信息通信研究院人工智能研究所平台部副主任李荪在会上表示,数据集建设正从通用基础数据集转向行业高质量数据集,需要构建全流程闭环管理的数据工程体系,重点突破合成数据工业化生产、数据增强与扩充、全链路质量控制、异构数据融合等技术,以及加快推动高端数据标注与行业数据标注产业发展。
会上,“人工智能高质量数据集炼金工坊生态行”正式启动。当天下午,生态行首站活动在成都高新区同步开展。中国电信、海天瑞声、四川长虹等多家企业代表齐聚现场,分享各自在高质量数据集和数据标注建设方面的实践成果,为行业提供宝贵经验。
“高质量数据集炼金工坊”由中国信息通信研究院人工智能研究所联合多家单位共同发起,旨在打造一个人工智能与数据要素协同发展的可持续生态体系,将原始数据转化为具有高价值的“数据黄金”,为人工智能发展提供源源不断的动力。
后续,生态行系列活动也将在全国各地落地,推动数据资源、技术能力与产业需求的有效对接。
从技术前沿的深度研讨到场景落地的实践分享,从单一成果发布到生态体系构建,大会已成为推动大模型技术转化、赋能实体经济的重要桥梁。未来,大会将持续深化政产学研用协同,为千行百业的智能化转型注入动力。
熊英英 红星新闻记者 李伟铭