仅一个月,DeepSeek再升级!单项测试最大提升超36%

次浏览

摘要:9月22日晚间,DeepSeek官方宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方API价格保持不变,百万tok

9月22日晚间,DeepSeek官方宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方API价格保持不变,百万tokens输入(缓存命中)0.5元,输出12元。

据称,DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定。官方发布的测试结果显示,新版本模型在“Humanity‘s Last Exam”测试中的得分从上一代的15.9分大幅提升至21.7分,提升幅度超过36%,在“BrowseComp”测试中得分较上一代提升28.3%。

此前8月21日,DeepSeek宣布发布DeepSeek-V3.1,使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。随后,不少国产芯片产业链企业股价大涨。

不过,该版本曾被用户指出存在“极”字异常输出及中英俄三语混用现象,严重时影响代码可用性。

DeepSeek表示,此次更新的DeepSeek-V3.1-Terminus版本在保持模型原有能力的基础上,重点针对用户反馈进行了优化,包括提升语言一致性(缓解中英文混杂、偶发异常字符等),以及增强Agent能力(进一步优化Code Agent与Search Agent的表现)。

值得注意的是,此次更新距V3.1发布仅一个月。业内人士指出,在开源模型竞争趋于白热化的背景下,快速修复Bug、提升智能体能力将成为留住开发者的关键。

国盛证券金融工程团队分析师张国安在研报中分析指出,DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,同时DeepSeek提出多项算法创新,打破了海外算力堆砌的传统大模型提升路径,展示出中国在AI领域已经具备与全球顶尖水平竞争的实力。这将使全球投资者对中国科技企业的技术创新能力塑造新的认知,进而对中国科技资产重新进行价值评估。

国海证券发布研报称,大模型训推带动AI算力需求增长,GB300、Vera Rubin等新一代算力架构将推出,算力产业链中的AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节有望持续受益。

(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)

随机内容
5.94万亿美元!AI“军备竞赛”助推 今年全球发债规模创纪录 5.94万亿美元!AI“军备竞赛”助推 今年全球发债规模创纪录
Metsera减重药物表现出色,巨头竞价下公司估值大爆发 Metsera减重药物表现出色,巨头竞价下公司估值大爆发
行业深度分析师调低微软&亚马逊评级 称应重新审视AI经济效益 行业深度分析师调低微软&亚马逊评级 称应重新审视AI经济效益
AI领域“强强联手”:OpenAI与富士康达成合作,在美生产新兴硬件! AI领域“强强联手”:OpenAI与富士康达成合作,在美生产新兴硬件!
满屏都“带电”!AI用电荒催化电力设备板块 “新瓦特时代”谁将受益? 满屏都“带电”!AI用电荒催化电力设备板块 “新瓦特时代”谁将受益?
擘画2-5年AI新版图 闽浙粤竞速算力与智能体 擘画2-5年AI新版图 闽浙粤竞速算力与智能体
现场直击医保国谈第三日:创新药继续“扛大旗” 有企业手持产品进场 现场直击医保国谈第三日:创新药继续“扛大旗” 有企业手持产品进场
售价翻三倍、需求增五成,存储市场“火热”外衣之下产业链冷暖不一 售价翻三倍、需求增五成,存储市场“火热”外衣之下产业链冷暖不一
超六成MEGA被召回  理想汽车:希望不再发生自燃事故 超六成MEGA被召回 理想汽车:希望不再发生自燃事故
亚马逊领千亿大单入伙 一文盘点OpenAI签了多少“愿景支票” 亚马逊领千亿大单入伙 一文盘点OpenAI签了多少“愿景支票”