3月1日晚间消息,DeepSeek开源周第六日,DeepSeek官方团队在Github和知乎上公布了DeepSeek-V3/R1推理系统的技术解读。据官方介绍,通过优化吞吐和延迟,DeepSeek“理论上一天的总收入为562027美元,成本利润率545%”。
在该技术解读发布后,硅基流动创始人、CEO袁进辉第一时间现身评论区点评道:“DeepSeek 官方披露大规模部署成本和收益,又一次颠覆了很多人认知。”他指出,“现在很多供应商还做不到这个水平,主要是V3/R1架构和其它主流模型差别太大了,由大量小Expert组成,导致瞄准其它主流模型结构开发的系统都不再有效,必须按照DeepSeek报告描述的方法才能达到最好的效率,而开发这样的系统难度很高,需要时间,幸好这周DeepSeek五连发已经把主要模块开源出来了,降低了社区复现的难度。”
	
袁进辉表示,“这些成果充分体现了DeepSeek团队第一性原理的思考方式和强悍的意志,他们应该是首先是基于某些原因想到了用这样的模型结构,然后发现这样的结构无论是训练还是推理,要做好都有非常大的工程挑战,不过这些问题在他们工程团队来说并不是搞不定的,关键是花那么大力气做完是否有大的收益呢,在最终结果出来前,谁也说不准,他们还是赌了,结果是赌对了。”
当然,对于上述推测,袁进辉也进一步表示,“这也可能是反过来的,基于系统的出发点设计了这样一个全新的模型结构。”
今年春节期间,在DeepSeek-R1、DeepSeek-V3 开源并引发广泛关注后,硅基流动作为初创企业,领先业内绝大多数企业率先宣布大模型云服务平台 SiliconCloud 上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1,允许用户通过SiliconCloud使用稳定的DeepSeek访问服务。
据袁进辉个人透露,公司是赌DeepSeek最早的团队了,DeepSeek V2时,很长一段时间公司是官方之外唯一第三方供应商。“我们当时眼光为什么那么好呢?其实主要是赌开源,也只能用开源模型,但当时开源模型普遍还不太行,DeepSeek恰好开源了,编程能力非常突出,很多人想用,就只好硬着头皮把DeepSeek支持了。”袁进辉表示。(文猛)
主要观点 价格 PVC价格持续小幅阴跌,没有出现任何有...
专题:第九届复旦首席经济学家论坛 “第九届复旦首席经济学家论坛”于11月23日举行。十四届全国政协常委、经济委员会副主任、国务院发展研究中心原党组书记、 国家...
澳元收复失地,尽管周一风险厌恶情绪有所改善。然而,对美元的重新需求给澳元兑美元带来了压力。由于持续的高通胀、强劲的零售销售和服务业PMI促使澳洲联储推迟可能的降息,澳元得到了支撑。...
专题:2024世界人工智能大会:以共商促共享 以善治促善智 7月5日晚间消息,2024世界人工智能大会期间,360集团副总裁、360数智化集团...
阿克曼说,他不会卸下工作去政府任职,但“就像做了六份全职工作的马斯克一样”,他很乐意帮政府效率委员会(DOGE)取得成功。 &ems...