DeepSeek新版本API价格下调 寒武纪:对新模型DeepSeek

花花2025-09-30债务科普79

专题:A股四季度牛市氛围有望延续 机构建议关注“科技成长”与“反内卷”主线

炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

DeepSeek新版本API价格下调 寒武纪:对新模型DeepSeek

9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型版本。据介绍,这是一个实验性(Experimental)版本,在此前版本V3.1-Terminus的基础上引入DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行探索性的优化和验证。目前,DeepSeek的App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。同时,得益于新模型服务成本的大幅降低,API价格也相应下调。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

记者注意到,9月29日晚,寒武纪在“寒武纪开发者”公众号发文称,公司已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。

寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。此前,公司对DeepSeek系列模型进行深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化,并基于计算与通信的并行策略,再次达成业界领先的计算效率水平。

“华为计算”公众号发文称,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。华为昇腾在DeepSeek-V3.2-Exp一发布开源即实现DeepSeek-V3.2-Exp BF16模型部署,并在CANN平台上完成对应的优化适配,整体部署策略沿用DeepSeek的大EP并行方案,针对稀疏DSA结构,叠加实现长序列亲和的CP并行策略,兼顾时延和吞吐,在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。

近日,DeepSeek持续推进模型迭代。8月21日,DeepSeek宣布发布DeepSeek-V3.1。一个月后,9月22日,DeepSeek宣布DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本,在保持模型原有能力的基础上,针对用户反馈的问题进行改进,包括语言一致性方面,缓解了中英文混杂、偶发异常字符等情况。

相关文章

8月4日操盘必读:影响股市利好或利空消息

8月4日操盘必读:影响股市利好或利空消息

专题:预计A股市场阶段性震荡整固 慢牛行情行稳致远 影响股市利好与利空消息 宏观新闻 1、近日,中国人民银行召开2025年下半年工作会议暨常态长效推动中央巡视整改工作推进会。其中提到,继续实施好适度宽...

新债王:私募市场是下一个市场重大事件,如同2007年的次贷

新债王:私募市场是下一个市场重大事件,如同2007年的次贷

新债王表示,私募信贷的支持者声称其波动性低于公募,但这种说法基于不频繁的市场估值调整,而且私募信贷领域的估值高度不透明。正如2007年次贷危机的爆发,最初被认为只是一个小问题,但最终引发了广泛的连锁反...

石油市场预期已久的供应过剩临近 交易员紧盯中国的采购动向

石油市场预期已久的供应过剩临近 交易员紧盯中国的采购动向

随着石油市场即将迎来预期已久的供应过剩,交易员正在密切关注中国的采购动向,以确定中国是否会吸收由产油国增产所导致的多余供应。 今年早些时候,中国入市大举购入了数百万桶石油,其中一部分流入战略储备。自那...

中国银行业协会原党委委员、秘书长黄润中被开除党籍

中国银行业协会原党委委员、秘书长黄润中被开除党籍

中央纪委国家监委网站讯 据中央纪委国家监委驻国家金融监督管理总局纪检监察组、福建省纪委监委消息:日前,经中央纪委国家监委批准,中央纪委国家监委驻国家金融监督管理总局纪检监察组、福建省泉州市监委对中国银...

GRI前董事吕建中:构建风险共治、价值共创、标准共建、平台共搭、资源共享的ESG生态圈

GRI前董事吕建中:构建风险共治、价值共创、标准共建、平台共搭、资源共享的ESG生态圈

专题:2025全球总部经济大会暨中国楼宇经济北京论坛 9月11日,由世界贸易网点联盟、中国产业发展促进会主办,中国产业发展促进会楼宇经济和总部经济分会、集群智库承办、商天信息网财经、服贸会官网全程直播...

高德:单日新入驻餐饮商家数涨631%,创历史峰值

高德:单日新入驻餐饮商家数涨631%,创历史峰值

商天信息网科技讯 9月24日下午消息,高德昨日宣布给全国所有餐饮商家免一年入驻年费。从高德方面获悉,该项支持举措发布还不到24小时,仅9月23日当天,单日新入驻高德的餐饮商家数已环比暴涨631%,创造...