Library
SIGN IN
Prev
Next
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Send
Trending
Ask AI
Library
You
Sign in
Help
Toggle theme
Trending
Ask AI
Library
You
Enjoy Podwise!
Enjoy Podwise!
Sign in to sync your playlist
Playlist 0/50
Prev
Next
11 Feb 2025
3h
20m
91. 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏”
张小珺Jùn|商业访谈录
Play
Summary
Mindmap
Transcript
Keywords
Highlights
Shownotes
Sign in to access all AI-generated content
Continue
本期访谈节目重点解读了 DeepSeek 公司及其一系列研究论文,主持人张小珺与香港科技大学助理教授何俊贤围绕 DeepSeek 大模型的技术路线和创新展开讨论。何俊贤老师从 DeepSeek 的第一篇论文开始,详细讲解了 DeepSeek LLM、MOE 模型、V2、V3 以及 R1 等模型的技术细节,并重点分析了 DeepSeek 在模型推理方面的创新,例如多头潜在注意力机制 (MLA) 和 GRPO 算法。访谈还探讨了 DeepSeek 公司独特的文化和发展策略,例如其对成本效率的极致追求和对科研的严谨态度,以及在强化学习方面的探索和对刷榜行为的坦诚态度。通过对这些论文的解读,听众可以更深入地理解 DeepSeek 的技术发展历程及其在 AGI 领域的贡献。
Takeaways
Outlines
Q & A
Preview
How to Get Rich: Every Episode
Naval