07 Mar 2025
1h 20m

DeepSeek 开源周 | 全景解读与我们的思考,开源加速 AI 创新

Podcast cover

AI炼金术

本期 AI 炼金术访谈节目重点讨论了 DeepSeek 开源周发布的多个项目,包括 FlashMLA(一种改进的注意力机制以提升推理速度)、DeepEP(用于优化 MOE 模型中专家间通信的库)、DeepGEMM(重写的矩阵乘法库以提高 FP8 精度计算速度)、DualPipe 和 EPLB(旨在最大化 GPU 利用率的流水线并行技术),以及 3FS(一种基于 SSD 的分布式文件系统以降低存储成本)。 两位嘉宾深入探讨了这些技术的原理和应用场景,并分析了 DeepSeek 开源的战略意义,例如提升技术品牌形象和扩大生态系统。 访谈还延伸到开源生态对 AI 应用开发的影响,指出掌握用户场景的公司将成为最大受益者,例如阿里巴巴通过钉钉等平台整合 AI 能力。 一个具体的例子是,语数公司利用钉钉指挥机器人完成线下任务,展现了 AI 与实际应用场景的结合。 总而言之,本期节目为听众提供了对 DeepSeek 开源项目及 AI 产业发展趋势的深入解读。

Outlines

Part 1: DeepSeek开源技术栈概述

Part 2: 开源意义与行业影响

Part 3: 性能优化与长期战略

Part 4: 未来展望与机遇

Sign in to continue reading, translating and more.

Open full episode in Podwise