Library
SIGN IN
Prev
Next
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Send
Trending
Ask AI
Library
You
Sign in
Help
Toggle theme
Trending
Ask AI
Library
You
Enjoy Podwise!
Enjoy Podwise!
Sign in to sync your playlist
Playlist 0/50
Prev
Next
11 Feb 2025
3h
20m
91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”
张小珺Jùn|商业访谈录
Play
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Sign in to access all AI-generated content
Continue
本期访谈节目重点解读了 DeepSeek 公司发布的九篇论文,主持人张小珺与香港科技大学助理教授何俊贤深入探讨了 DeepSeek 模型的技术路线和发展历程。何俊贤老师从 DeepSeek 的第一个大模型论文开始,详细分析了其基础模型(DeepSeek LLM, MOE, V2, V3)和推理能力(DeepSeek Coder, Math, R1)的演进,并着重介绍了 DeepSeek 在降低模型训练和推理成本方面的创新技术,例如多头潜在注意力机制 (MLA) 和高效的强化学习方法 GRPO。 通过对论文的解读,听众可以更深入地了解 DeepSeek 的技术创新和发展策略,以及其在 AI 领域的影响力。 例如,何俊贤老师指出 DeepSeek 在超参数缩放律 (scaling law) 研究上的严谨性,以及其在模型训练中对成本控制的极致追求。
Takeaways
Outlines
Q & A
Preview
How to Get Rich: Every Episode
Naval