DeepSeek AI新模型曝光:搭载 MODEL1 全新架构,最快2月上线
创始人
2026-01-21 14:33:19
0

来源:环球网

【环球网科技综合报道】1月21日消息,据ITPro报道,DeepSeek计划于今年2月中旬农历新年期间,推出新一代旗舰AI模型DeepSeek V4。该模型将搭载全新技术架构,写代码能力有望实现显著提升,引发行业广泛关注。

1月20日,恰逢DeepSeek-R1模型发布一周年,有开发者在GitHub平台发现,DeepSeek更新了一系列FlashMLA相关代码。在涉及的114个文件中,28处明确提及未知的“MODEL1”大模型标识符,且该标识符与现有模型“V32”(即DeepSeek-V3.2)被并列或区分引用。通过代码上下文分析,技术人士推测,“MODEL1”大概率对应一款采用全新架构的AI模型,其核心技术特征与现有模型存在明显差异。

具体来看,新架构在键值(KV)缓存布局、稀疏性处理方式以及FP8数据格式解码支持等关键技术环节进行了优化调整。这些技术革新针对性解决了模型运行中的内存占用与计算效率问题,为模型性能提升奠定了基础。

值得关注的是,DeepSeek研究团队此前已连续发布两篇技术论文,分别提出“优化残差连接(mHC)”的创新训练方法,以及受生物学启发研发的“AI记忆模块(Engram)”。业内普遍推测,即将发布的DeepSeek V4有望整合这些最新研究成果,进一步释放AI模型在复杂任务处理中的潜力。(纯钧)

相关内容

土星再添128颗卫星!最小...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-01-22 06:27:48
物理学发展百年,这些术语何...
  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力...
2026-01-22 06:27:44
今年计划开通轨道交通22号...
轨道交通22号线平谷段正在紧锣密鼓地施工中。本报记者 潘之望摄20...
2026-01-22 06:27:39
打出有力有效监督“组合拳”...
(来源:东北新闻网)  在关于数字政府建设的专题询问上,经过多轮深...
2026-01-22 06:23:47
涉嫌严重违纪违法,牛晋华被...
据中央纪委国家监委驻国家税务总局纪检监察组、山西省纪委监委消息,原...
2026-01-22 06:23:43
量台湾之物力结美国之欢心莫...
(来源:团结报)转自:团结报  □ 煌  言  不演了!就在这几天...
2026-01-22 06:23:37
破解危旧楼改造融资困境
位于北京市西城区三里河一区的28号楼是北京市老旧小区综合整治项目之...
2026-01-22 06:23:33
让非遗火在当下传向未来
转自:贵州日报 贵州日报天眼新闻记者 权若青冬日贵阳寒意渐浓,五彩...
2026-01-22 06:23:28
大行回应!消费贷贴息政策升...
(来源:上观新闻)消费贷贴息政策迎来重要升级,落地细节备受关注。1...
2026-01-22 06:23:22

热门资讯

土星再添128颗卫星!最小才两...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:文汇报)随着...
物理学发展百年,这些术语何以成...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:文汇报)物理...
今年计划开通轨道交通22号线 轨道交通22号线平谷段正在紧锣密鼓地施工中。本报记者 潘之望摄2026年,北京交通服务将迈上新台阶。...
打出有力有效监督“组合拳”——... (来源:东北新闻网)  在关于数字政府建设的专题询问上,经过多轮深入问答后,与会者形成了这样的共识—...
涉嫌严重违纪违法,牛晋华被查 据中央纪委国家监委驻国家税务总局纪检监察组、山西省纪委监委消息,原山西省地方税务局副巡视员牛晋华涉嫌...
量台湾之物力结美国之欢心莫过于... (来源:团结报)转自:团结报  □ 煌  言  不演了!就在这几天,民进党当局与美国达成所谓“重大贸...
破解危旧楼改造融资困境 位于北京市西城区三里河一区的28号楼是北京市老旧小区综合整治项目之一。该楼建于1978年,共有居民5...
让非遗火在当下传向未来 转自:贵州日报 贵州日报天眼新闻记者 权若青冬日贵阳寒意渐浓,五彩黔艺民族服饰博物馆的实训教室里却暖...
大行回应!消费贷贴息政策升级,... (来源:上观新闻)消费贷贴息政策迎来重要升级,落地细节备受关注。1月20日晚间,多家国有大行表态将积...
误购火车票可以免费退 程 硕作(新华社发) 据中国国家铁路集团有限公司消息,自1月19日起,铁路12306平台推出旅客误购...