来源:@界面新闻微博
2025年,生成式人工智能继续实现用户规模和普及率的爆发式增长,国产开源大模型的AI生图、生视频工具的技术能力飞速提升,应用场景持续拓展,相关产品功能也日趋成熟。
12月2日,新版千问APP同时接入了Wan2.5视频生成模型和Qwen-image图像生成模型,实现了音画同步生成10秒AI视频,以及精准图像编辑、图像融合的能力。
Wan2.5是国内最先进的视频生成模型之一,性能对标 google veo3。用户可在新版千问App的主对话场景下使用自然语言输入需求,即可一键制作5s或10s的视频,最高可支持1080p清晰度。支持音画同步、高保真音频生成,涵盖人声、音效、音乐、ASMR等多种声音类型,且支持中文、英文、小语种和方言,生成质量和适配性均达到了国际开源大模型的顶尖水平。针对以图生视频的需求,千问App的动态表现力良好、人物一致性出色,光影效果和镜头语言都相当惊艳。
而千问接入的Qwen-Image图像生成模型,在全球最大的AI开源模型社区Hugging Face趋势榜霸榜数周,在图像开源大模型领域登顶全球首位,其对中文语义的深度理解能力与多轮指令交互能力成为业内关注焦点。千问App为用户开放了Qwen-Image“满血特供版”,支持从日常图片制作到商业级图片编辑的全场景需求,且支持多轮对话修改,真正实现了“所言即所得”。
升级版千问App上线以来,迅速收获广泛好评,尤其是Qwen-Image“满血特供版”对中文文本的理解能力,更是获得了内容创作者的高度肯定。千问App对多指令、长难prompt的理解到位,支持当下各类流行玩法,为内容创作者提供了更高的自由度。
在图生图功能中,用户可通过简单的文本描述,对图片素材的任一元素进行修改或增减,也可将核心图片元素置入丰富的画面场景中,可适用于社交媒体展示、品牌宣传、电商推广等实际应用场景。
对一至多张图片进行处理时,千问App可实现图片拼贴、剪接、融合,并根据用户指令调整背景、人物姿态、宠物动作、互动方式等,同时维持主体元素的高一致性。
千问App的大幅升级,代表着多模态生成式大模型发展的前沿趋势。新版本千问App互动友好,生图、生视频功能均可免费试用,且生图不限次数,极大地降低了用户的使用门槛。千问App的图片和视频生成质量足以媲美国际顶尖大模型水平,已成为创作者强大的生产力工具。随着更多内容创作者参与到千问的生态建设中,千问AI创作工具的性能和使用场景将得到进一步的拓展,为生成式AI大模型行业带来更多的惊喜。