Deepseek的第三次战役：国产AI如何挑战OpenAI？

本期播客主要讲述 Deepseek 公司在 AI 大模型领域的三大战役：第一战是通过 V3 模型降低训练成本；第二战是 R1 模型在自然语言处理方面超越 OpenAI；第三战是多模态大模型 Janus Pro，旨在以更小规模的模型超越 OpenAI 在图像理解和生成的领域。播客详细分析了 Janus Pro 的技术细节，包括其架构、训练方法以及与其他模型的比较，并探讨了多模态大模型的技术现状和挑战。最终，播客强调了 Deepseek 通过降低训练成本，为中小企业参与 AI 大模型竞争提供了新的可能性，Janus Pro 的成功也为多模态模型的未来发展提供了新的方向。 Janus Pro 使用了 256 张 A100 显卡，耗时 14 天完成训练。

Outlines

Part 1: Deepseek 战役与多模态挑战

Part 2: 技术发展与模型比较

Part 3: Janus 核心与训练

Part 4: 成功因素与未来展望

Sign in to continue reading, translating and more.

Continue

AI 前线

Part 1: Deepseek 战役与多模态挑战

Deepseek 的三大战役概述

多模态大模型：Janus-pro 的挑战

多模态大模型的技术现状与缺陷

Part 2: 技术发展与模型比较

关键科学发现与技术发展历程

Janus 与其他多模态模型的比较

Part 3: Janus 核心与训练

Janus 的核心思想与技术细节

Janus 的训练过程与成本控制

Part 4: 成功因素与未来展望

Deepseek 的成功因素与未来展望

Deepseek的第三次战役：国产AI如何挑战OpenAI？

AI 前线

Part 1: Deepseek 战役与多模态挑战

00:01Deepseek 的三大战役概述

Deepseek 的三大战役概述

03:14多模态大模型：Janus-pro 的挑战

多模态大模型：Janus-pro 的挑战

09:11多模态大模型的技术现状与缺陷

多模态大模型的技术现状与缺陷

Part 2: 技术发展与模型比较

14:36关键科学发现与技术发展历程

关键科学发现与技术发展历程

21:06Janus 与其他多模态模型的比较

Janus 与其他多模态模型的比较

Part 3: Janus 核心与训练

27:46Janus 的核心思想与技术细节

Janus 的核心思想与技术细节

37:06Janus 的训练过程与成本控制

Janus 的训练过程与成本控制

Part 4: 成功因素与未来展望

49:15Deepseek 的成功因素与未来展望

Deepseek 的成功因素与未来展望