89. 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”

这是一期技术解读类访谈播客，加州大学伯克利分校人工智能实验室博士生潘家怡作为嘉宾，与主持人张小珺共同解读了 DeepSeek 近期发布的 DeepSeek R1 和 R1.0 模型，以及与之相关的 Kimi 1.5 模型和 OpenAI 的 O1 模型。访谈首先探讨了 DeepSeek 模型对 AGI 领域的影响，以及与 OpenAI 模型的异同，之后潘家怡详细讲解了 DeepSeek R1 论文的核心内容，包括其采用的强化学习算法 GRPO，奖励函数设计，以及模型训练过程中的关键步骤和技术细节，例如 “aha moment” 的出现。最后，访谈还讨论了模型成本估算、数据标注的重要性以及未来研究方向等问题，例如 DeepSeek R1 的训练成本可能在 10 万到 100 万美元之间。通过此次访谈，听众可以深入了解当前大模型领域强化学习技术路线的最新进展，以及相关模型的优缺点和未来发展趋势。

Outlines

Part 1: 开场与宏观趋势

Part 2: 模型技术演进

Part 3: DeepSeek R1模型详解

Part 4: Kimi K1.5模型分析

Part 5: 数据、竞争与未来展望

Sign in to continue reading, translating and more.

Continue

张小珺Jùn｜商业访谈录

Part 1: 开场与宏观趋势

节目开场和嘉宾介绍

DeepSeek 对 AGI 宏观趋势的影响和业内反馈

开源对 AI 生态的影响和大型模型公司的商业模式

Part 2: 模型技术演进

大型语言模型推理能力的提升和 AGI 路线图

OpenAI o1 模型的技术细节和强化学习的原理

Part 3: DeepSeek R1模型详解

DeepSeek R1 和 R1.0 模型的技术解读

DeepSeek R1 模型的强化学习算法和训练过程

DeepSeek R1 模型的实验结果和模型能力涌现

DeepSeek R1 模型的工程优化和模型蒸馏

小模型的强化学习和模型成本分析

Part 4: Kimi K1.5模型分析

Kimi K1.5 模型的技术细节和数据构造

Kimi K1.5 模型的强化学习算法和奖励模型

Kimi K1.5 模型的消融实验和未来发展方向

Part 5: 数据、竞争与未来展望

数据标注的重要性、模型的进一步增强和 DeepSeek 的未来

DeepSeek 与 OpenAI 的竞争、人才流动和行业发展趋势

89. 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净”

张小珺Jùn｜商业访谈录

Part 1: 开场与宏观趋势

02:10节目开场和嘉宾介绍

节目开场和嘉宾介绍

03:44DeepSeek 对 AGI 宏观趋势的影响和业内反馈

DeepSeek 对 AGI 宏观趋势的影响和业内反馈

12:05开源对 AI 生态的影响和大型模型公司的商业模式

开源对 AI 生态的影响和大型模型公司的商业模式

Part 2: 模型技术演进

16:14大型语言模型推理能力的提升和 AGI 路线图

大型语言模型推理能力的提升和 AGI 路线图

24:03OpenAI o1 模型的技术细节和强化学习的原理

OpenAI o1 模型的技术细节和强化学习的原理

Part 3: DeepSeek R1模型详解

33:00DeepSeek R1 和 R1.0 模型的技术解读

DeepSeek R1 和 R1.0 模型的技术解读

45:36DeepSeek R1 模型的强化学习算法和训练过程

DeepSeek R1 模型的强化学习算法和训练过程

57:07DeepSeek R1 模型的实验结果和模型能力涌现

DeepSeek R1 模型的实验结果和模型能力涌现

1:16:13DeepSeek R1 模型的工程优化和模型蒸馏

DeepSeek R1 模型的工程优化和模型蒸馏

1:33:04小模型的强化学习和模型成本分析

小模型的强化学习和模型成本分析

Part 4: Kimi K1.5模型分析

1:48:43Kimi K1.5 模型的技术细节和数据构造

Kimi K1.5 模型的技术细节和数据构造

2:02:07Kimi K1.5 模型的强化学习算法和奖励模型

Kimi K1.5 模型的强化学习算法和奖励模型

2:15:11Kimi K1.5 模型的消融实验和未来发展方向

Kimi K1.5 模型的消融实验和未来发展方向

Part 5: 数据、竞争与未来展望

2:24:31数据标注的重要性、模型的进一步增强和 DeepSeek 的未来

数据标注的重要性、模型的进一步增强和 DeepSeek 的未来

2:30:46DeepSeek 与 OpenAI 的竞争、人才流动和行业发展趋势

DeepSeek 与 OpenAI 的竞争、人才流动和行业发展趋势