91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”

张小珺Jùn｜商业访谈录

本期访谈节目重点解读了 DeepSeek 公司发布的九篇论文，主持人张小珺与香港科技大学助理教授何俊贤深入探讨了 DeepSeek 模型的技术路线和发展历程。何俊贤老师从 DeepSeek 的第一个大模型论文开始，详细分析了其基础模型（DeepSeek LLM, MOE, V2, V3）和推理能力（DeepSeek Coder, Math, R1）的演进，并着重介绍了 DeepSeek 在降低模型训练和推理成本方面的创新技术，例如多头潜在注意力机制 (MLA) 和高效的强化学习方法 GRPO。通过对论文的解读，听众可以更深入地了解 DeepSeek 的技术创新和发展策略，以及其在 AI 领域的影响力。例如，何俊贤老师指出 DeepSeek 在超参数缩放律 (scaling law) 研究上的严谨性，以及其在模型训练中对成本控制的极致追求。

Takeaways

Outlines

Q & A

Preview

How to Get Rich: Every EpisodeNaval