3月1日晚间消息,DeepSeek开源周第六日,DeepSeek官方团队在Github和知乎上公布了DeepSeek-V3/R1推理系统的技术解读。据官方介绍,通过优化吞吐和延迟,DeepSeek“理论上一天的总收入为562027美元,成本利润率545%”。
在该技术解读发布后,硅基流动创始人、CEO袁进辉第一时间现身评论区点评道:“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”他指出,“现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”

袁进辉表示,“这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。”
当然,对于上述推测,袁进辉也进一步表示,“这也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”
今年春节期间,在DeepSeek-R1、DeepSeek-V3 开源并引发广泛关注后,硅基流动作为初创企业,领先业内绝大多数企业率先宣布大模型云服务平台 SiliconCloud 上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,允许用户通过SiliconCloud使用稳定的DeepSeek访问服务。
据袁进辉个人透露,公司是赌DeepSeek最早的团队了,DeepSeek V2时,很长一段时间公司是官方之外唯一第三方供应商。“我们当时眼光为什么那么好呢?其实主要是赌开源,也只能用开源模型,但当时开源模型普遍还不太行,DeepSeek恰好开源了,编程能力非常突出,很多人想用,就只好硬着头皮把DeepSeek支持了。”袁进辉表示。(文猛)
砺石商业评论 11月末的茅台镇,气温已经下降,街上人影稀疏,街边不少卖酒的店铺大门紧闭。 &e...
今天(12日)一早,工商银行、农业银行、中国银行、建设银行、交通银行等多家银行陆续发布公告,10月25日起,将对存量个人房贷利率进行批量调整...
专题:市场运行趋于稳定 A股迎结构性估值重塑机会...
专题:全球屏息以待美国大选 市场将如何应对?...
9月13日,人民银行罕见在发布8月金融统计数据后挂出有关部门负责人的相关解读内容。在这份解读中,人民银行还就下一步货币政策的考虑和举措给出答案:将坚持支持性...