来源:MacTalk
其他人写出十万加评测全球第一款 AI Agent 手机的时候,我的豆包手机还在路上。等我拿到手的时候,嗷嚎,微信和阿里系产品、银行类产品已经全面禁止豆包 AI 使用了。豆包手机团队也表示,人家本来就不是面向普通消费者的,看清楚了,这是一款面向行业和 AI 技术爱好者的技术预览版的 AI 手机。
大概就这么个意思,所以大家之前演示的很多案例,操作个微信群啊,自动比价购物了,现在都已经不灵了,那我就单纯聊聊这款手机本身和我的一些体验。
先说结论,我觉得这样的手机未来就像自动驾驶一样,是不可阻挡的。AI 会深层次嵌入操作系统,至于实现的方式,我相信有更好的。问题肯定可以逐步解决。
这台 Nubia M153 是一台相对克制的直板手机:平直屏幕,边框收敛得比较窄,中框呈金属质感的直线造型,背板弧形过渡,整体有点像我在锤子科技发布的 M1,现在看起来并不时尚,说是技术预览版,所言非虚。背面是个不规则形状的摄像头模组,内含多颗镜头与闪光灯,电源与音量键在右侧,左侧是 AI 键,点按可以唤起豆包 AI。
显然,这台机器主打的不是外观和硬件,而是在机器的 OS 里内置了一个可以像人类一样操作手机的 AI Agent,能够在应用里自主完成任务。
想象一个场景,你在外地出差,发一家酒店的照片给豆包手机,说“今晚住这儿,无烟,预算 800 元以内”。豆包立即完成语义解析:识别酒店、推断入住时间与价格上限、理解“无烟”是个关键约束;本地的 Nebula‑GUI 随即接管界面行动,在相关应用中输入日期、筛选房型与价格、打开“无烟”条款确认,自动下单与支付。涉及密码和支付页时,会让用户确认。这事就干完了。
用户可以通过 AI 键或语音唤起,都需要打开手机做输入。想在锁定时使用豆包操作手机,需要用户录入声纹并手动打开这个开关,目前“锁定时声纹鉴别”还是 beta 版本,安全起见建议用户在开屏状态下使用 AI 功能,输入完之后锁屏即可,不影响 AI 干活。
可以说,这一步豆包走得相当大胆。全球所有地区的智能手机更多只是增加了由 AI 驱动的功能,比如独立的语音助手,通过接口和某些特定 App 交互,内置一些智能 App 和系统级的屏幕识别,我的另一部手机 Nothing Phone 就是这么干的。而豆包手机却迈出了一大步。
字节联合总部位于深圳的跨国通信公司 ZTE 中兴通讯推出这款由 AI Agent 驱动的智能手机。AI Agent 被直接集成进操作系统,于是 AI 可以像人类一样开始操作智能手机了。
在充分授权的情况下,豆包 AI 能看到用户界面、打开应用、下载应用、在屏幕上点击和输入、拨打电话,并在用户不需要知道该用哪款应用的情况下执行多步骤任务。简单说,这个 AI 用手机的方式更像一个人类用户,而不是一个应用进程。
豆包就是字节开发的大模型产品,我们可以在手机里选择云端模型,也可以选择本地模型。
显然,云端模型更加强大。
我拿到手的这台努比亚手机搭载的是第五代骁龙 8 至尊版(Snapdragon 8 Gen 5 Elite)芯片,配备 16 GB RAM,512 G 内存。如果你选择了云端模型,那 AI Agent 负责关键在云端进行推理,Nebula‑GUI 负责本地屏幕控制,针对安全和关键隐私环节,都需要用户介入操作。
对于豆包这个大模型,中国用户已经非常了解了,QuestMobile 数据显示,2025年9月,豆包以 1.72 亿月活跃用户稳居国内 AI App 榜首。豆包本质上是一个大型、稀疏的专家混合(Mixture-of-Experts)模型,多模态,支持文本与视觉。
其中的 AI Agent 则依赖了云 + 端的架构设计。
首先,豆包(云端)完成语义层工作,比如识别是哪家酒店、他要订今晚的房间、以及约束条件。其次,Nebula‑GUI(本地端)——是 ZTE 训练的一个 70 亿参数模型,负责物理操作,比如打开 App、输入日期、找到最优房价、在应用内查看约束规则,注意事项等等。
简单来说就是,豆包负责规划,Nebula‑GUI 负责执行,事情就搞定了。
为什么“简单来说”?因为这是原型机、体验机,豆包和努比亚可以实验性的做,并不需要告知其他厂商,因为是用户允许的嘛。但其他的国民 App,比如微信、淘宝、美团、小红书等等,是否希望一个 AI Agent 直接去访问自己呢?
显然答案是否定的,要不豆包手机被“围剿”呢。
换成苹果手机的场景,大家就更容易理解了。如果苹果的 Siri 想变得这么智能,需要有一个云端的大模型,也许是苹果自研,也许是 ChatGPT、Gemini,或者是中国阿里的千问,百度的文心等等,另外,苹果还需要一个具备强大智能 AI GUI,同时,如果苹果 AI 需要去和第三方 App 进行交互,要么通过类似 MCP 这样的协议进行,要么就类似 Nebula‑GUI 这样直接让 AI 访问 App。
根据苹果的用户体量和原则,苹果公司需要和那些超级 App 一起制定大量的规则,去推动实现这种功能,包括很多利益相关的谈判。
你看,苹果从 2008 年开始,通过 App Store 坐地收取 30% 虚拟产品的收入税,香不香,简单不简单,容易不容易,那他会去做这么难的事吗?短期看不可能。
现阶段也没有其他厂商会这么做。技术做出来容易,但涉及 App 墙,推广就难了。这和自动驾驶一个道理。
这对我们意味着什么呢?一种可能性。
一款手机,由一个支持多模态推理的大模型驱动,就可以理解用户意图、通过应用的菜单和工作流实现用户需要。也就是说,只要给手机一个意图,它就能自己处理执行并反馈给你结果,关键时刻会和用户交互确认,以达成最终目标。
这种可能性,已经变成了现实。这台原型机清晰地展示了智能体手机可以像科幻电影一样改变我们的生活。它也表明了,真正的智能手机,可能来自中国的一体化的 AI 与移动生态,而不是硅谷。
特别声明:以上内容仅代表作者本人的观点或立场,不代表Hehson财经头条的观点或立场。如因作品内容、版权或其他问题需要与Hehson财经头条联系的,请于上述内容发布后的30天内进行。