仅一个月,DeepSeek再升级!单项测试最大提升超36%

次浏览

摘要:9月22日晚间,DeepSeek官方宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方API价格保持不变,百万tok

9月22日晚间,DeepSeek官方宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。官方API价格保持不变,百万tokens输入(缓存命中)0.5元,输出12元。

据称,DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定。官方发布的测试结果显示,新版本模型在“Humanity‘s Last Exam”测试中的得分从上一代的15.9分大幅提升至21.7分,提升幅度超过36%,在“BrowseComp”测试中得分较上一代提升28.3%。

此前8月21日,DeepSeek宣布发布DeepSeek-V3.1,使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。随后,不少国产芯片产业链企业股价大涨。

不过,该版本曾被用户指出存在“极”字异常输出及中英俄三语混用现象,严重时影响代码可用性。

DeepSeek表示,此次更新的DeepSeek-V3.1-Terminus版本在保持模型原有能力的基础上,重点针对用户反馈进行了优化,包括提升语言一致性(缓解中英文混杂、偶发异常字符等),以及增强Agent能力(进一步优化Code Agent与Search Agent的表现)。

值得注意的是,此次更新距V3.1发布仅一个月。业内人士指出,在开源模型竞争趋于白热化的背景下,快速修复Bug、提升智能体能力将成为留住开发者的关键。

国盛证券金融工程团队分析师张国安在研报中分析指出,DeepSeek具备高性能、低成本、蒸馏有效、开源等核心优势,同时DeepSeek提出多项算法创新,打破了海外算力堆砌的传统大模型提升路径,展示出中国在AI领域已经具备与全球顶尖水平竞争的实力。这将使全球投资者对中国科技企业的技术创新能力塑造新的认知,进而对中国科技资产重新进行价值评估。

国海证券发布研报称,大模型训推带动AI算力需求增长,GB300、Vera Rubin等新一代算力架构将推出,算力产业链中的AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节有望持续受益。

(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)

随机内容
物流人形机器人爆发前夜:厂家频获订单,“轮式”成趋势|行业观察 物流人形机器人爆发前夜:厂家频获订单,“轮式”成趋势|行业观察
财联社创投通:一级市场本周91起融资环比减少9%,卓驭科技获中国一汽超36亿元战略投资 财联社创投通:一级市场本周91起融资环比减少9%,卓驭科技获中国一汽超36亿元战略投资
日本巩固“AI兴国”战略:拟每年投入1万亿日元扶持芯片和AI产业 日本巩固“AI兴国”战略:拟每年投入1万亿日元扶持芯片和AI产业
近一年涨幅超90%!AI算力、新能源主题产品强势领涨 近一年涨幅超90%!AI算力、新能源主题产品强势领涨
存储芯片涨价风暴前所未有!大摩上调三星、SK海力士目标价 存储芯片涨价风暴前所未有!大摩上调三星、SK海力士目标价
马斯克xAI融资最新动态:据悉以2300亿美元估值筹资150亿美元 马斯克xAI融资最新动态:据悉以2300亿美元估值筹资150亿美元
达里奥辣评“AI泡沫”:确实存在,美联储“转鹰”才会破裂! 达里奥辣评“AI泡沫”:确实存在,美联储“转鹰”才会破裂!
聚辰股份Q3净利同比增67.69% DDR5SPD芯片等出货量同比快速提升 聚辰股份Q3净利同比增67.69% DDR5SPD芯片等出货量同比快速提升
非洲寿命最长的树木,一次可储100吨水,穷人还能当房子住! 非洲寿命最长的树木,一次可储100吨水,穷人还能当房子住!
AI交易过于火爆?四大迹象证明:投资者正重新评估! AI交易过于火爆?四大迹象证明:投资者正重新评估!