1月9日,在阿里云通义智能硬件展上,一款能同时下四类棋局的“元萝卜”机器人正在与小朋友对弈,围棋落子声与孩子的惊叹声交织——这不再是科幻电影中的场景,而是AI大模型赋能硬件后落地的真实体验。
作为阿里云开年在深圳的首个硬件展,此次展会现场展示了超76个品类,200多个展商以及1000多件AI硬件展品。同时,阿里云宣布,推出多模态交互开发套件,集成千问、万相、百聆三款通义基础模型,旨在为AI眼镜、学习机、机器人等设备注入更强大的感知与交互能力。
硬件“智变”:从陪伴玩具到专业教练
此次展会上,搭载通义大模型的硬件产品覆盖生活全场景。
商汤科技旗下的“元萝卜”机器人不仅支持中国象棋、围棋等四类棋局,还化身“AI启蒙老师”,通过拟人化教学与实时对话激发孩子学习兴趣。
展会现场的下棋机器人 本报记者 齐金钊 摄聚焦日常生活陪伴场景,长虹旗下企业研发的AI仿真熊猫“虹宝”,凭借生物拟真技术吸引了不少“粉丝”驻足。据现场工作人员介绍,这款产品还原了一只1.5月龄的熊猫幼崽的形态,通过拟真行为与交互,可以为用户提供可触摸、有温度的情感替代。
AI仿真熊猫 本报记者 齐金钊 摄面向消费场景,跨维智能研发的机器人DexForce W1 Pro化身为咖啡师,在现场熟练地为顾客制作咖啡。工作人员介绍,这款产品是公司研发的第二代通用人形机器人,该机器人未来将搭载通义千问大模型,支持自然语音实时互动、随心畅聊沟通,实现精准语义理解与意图解析,全链路打通“语音交互—决策规划—任务执行”闭环,可自主完成多场景复杂作业指令。
人形机器人在制作咖啡 本报记者 齐金钊 摄面向运动健身场景,AI网球机器人ACEMATE S10十分吸睛。据介绍,它深度集成通义千问VL大模型能力,具备动态推理与深度思考能力,就像一位专业的网球教练。在训练过程中,它能实时预判球路、记录落点并制定战术策略,让网球训练变得更加有趣和高效。
针对休闲健康领域,荣泰健康与阿里云在展会上联合推出了最新款智能按摩椅。据介绍,这款产品内置健康大模型,通过语音交互定制个性化理疗方案,可实现“AI+健康”场景闭环。
推出多模态交互开发套件
记者了解到,在举办此次智能硬件展的同时,阿里云还正式推出多模态交互开发套件。
据介绍,近年来,随着多模态大模型的发展,大模型已开始具备理解、感知以及与物理世界交互的能力,越来越多的硬件和终端设备厂商开始通过接入大模型来提升交互体验。然而,仅靠基础大模型仍无法同时满足硬件设备对低成本、低时延、功能丰富和高质量效果的需求。
为此,阿里云多模态交互开发套件为硬件企业和解决方案商提供了低开发门槛、响应速度快、场景丰富的平台。在芯片层面,该套件适配了30多款主流ARM、RISC-V和MIPS架构终端芯片平台。
在模型优化层面,除通义模型家族外,阿里云针对大量多模态交互场景进行分析,推出适合AI硬件交互的专有模型,支持语音、视频、图文等交互方式,端到端语音交互时延低至1秒,视频交互时延低至1.5秒。
此外,该套件预置十多款MCP工具和Agent,覆盖生活、工作、娱乐、教育等多个场景。
阿里云还在现场展示了面向智能穿戴设备、陪伴机器人、具身智能等领域的解决方案。例如在AI眼镜领域,基于千问VL、百聆CosyVoice等模型,阿里云打造了感知层、规划层、执行层以及长期记忆的完整交互链路,可一站式实现同声传译、拍照翻译、多模态备忘录、录音转写功能。
面向家庭陪伴机器人场景,基于千问模型和多模态交互套件,阿里云推出的解决方案不仅可实时监测异常状况,并及时告警信息推送,用户还能基于关键词查找、定位视频,与机器人进行对话交互和控制设备等。