本期播客讨论了大语言模型 DeepSeek 爆火的原因及其对硬件和芯片行业的影响。两位嘉宾,行云科技 CEO 季宇和丰瑞资本投资人李刚,分享了各自使用 DeepSeek 的经验,并从技术(MoE 架构、推理成本降低)和市场(开源免费、春节效应)角度分析了其出圈原因。他们认为 DeepSeek 的成功并非偶然,而是中国科技公司在算力受限环境下,被迫探索出的一条新路径,并可能对英伟达的垄断地位构成挑战。最终,讨论延伸到 AI 模型的未来发展,包括模型评价标准的转变和新的商业模式的探索。
Sign in to continue reading, translating and more.
Continue