转自:贵州日报
贵州日报天眼新闻记者 李姗
7月3日,记者走进贵州移动贵阳数据中心,64台服务器、512张算力加速卡正昼夜不停地运转,这里是中国移动“4+N+31+X”布局中的西部核心。“这座我们自建的‘词元工厂’算力已达143PFlops,同时纳管了第三方算力资源,总存储容量约1PB。”贵州移动智算中心智算工程师周昂果介绍。
“从算力资源到词元服务,关键是要完成资源池化、平台化调度、模型服务化和运营产品化。”周昂果解释,具体路径分为四步:底层把智算服务器、存储、网络、安全等资源纳入统一资源池;通过云管平台实现资源纳管、监控告警和调度编排;在贵州移动智算中心搭建的智算服务平台上承载模型服务、租户权限、服务目录、调用计量和运行监控;将这些能力包装成企业可以直接使用的词元服务。
形象地说,过去的算力中心像一个“五金超市”,摆满了服务器、显卡、存储等“原材料”,用户买回去还得自己动手组装、调试、运维;现在我们的“词元工厂”则直接交付“标准件”——用户只需通过API接口,就能按需调用问答、摘要、推理、生成等AI能力,不再需要自建昂贵的AI算力集群,也不用为管理上百张显卡发愁,只需调用贵州移动的“词元工厂”的Token,按实际消耗付费即可。
周昂果说,用户对AI的需求千差万别,单一模型无法包打天下。贵州移动的策略是“开源+闭源”并举,目前已部署Qwen、DeepSeek、MiniMax、ChatGLM、Kimi等大模型。“开源模型的优势在于可控、可本地化适配,适合对数据安全和成本控制要求较高的政企场景;闭源模型的通用能力强、更新快,适合快速试用和复杂任务处理。”通过智算服务平台统一管理多模型能力,用户可以在同一个平台上获得多档位、多能力、多成本区间的词元服务。目前,已支撑起智能客服、办公助手、知识库问答、金融研报、政务咨询、工业运维、安全运营、内容生成等七大活跃场景。
数据显示,今年年初,贵州移动Token日调用量为40亿,截至目前已突破120亿,实现3倍增长。用户需求正从“体验式试用”加速转向“业务流程嵌入”。
在保障效果的前提下降低成本,是用户最现实的诉求。“贵州移动的平台具备智能路由能力,可自动匹配更经济的模型和资源组合。再叠加贵州低温节能优势,Token综合调用成本较行业平均水平降低20%以上。”周昂果表示,在商业模式上,贵州移动力求灵活务实,面向不同用户提供按量计费、按词元包计费、按调用次数计费等灵活的多元商业模式,旨在精准匹配不同规模用户的需求,真正让好用不贵落到实处。
上一篇:长桥飞越黔通出海
下一篇:我省设立12个“音乐文化小院”