29 Mar 2026
31m

「1 亿 TOKEN 俱乐部」挤爆了,AI 的燃料不够了|对谈于文渊:阿里云百炼技术负责人

Podcast cover

十字路口Crossing

Summary

本期播客聚焦于 AI 技术浪潮下,云计算领域的新变化与创业机会。阿里云百炼的研发负责人于文渊作为嘉宾,分享了他对算力、Token 消耗以及云服务未来发展趋势的观察。对话中,于文渊提到 Claude Code 和 OpenClaw 等技术的兴起加速了 Token 的消耗,并引发了全球范围内的算力短缺。他认为,AI 正在深刻地改变算力的使用方式,并预测未来三到五年云计算的范式将发生天翻地覆的变化。于文渊还强调,尽管面临英伟达断供等挑战,中国在 AI 和算力领域仍有巨大的发展潜力,并坚信自主可控的技术终将成为世界领先。

Outlines

Part 1: 嘉宾背景与 AI 浪潮观察

00:02

十字路口播客介绍:关注 AI 技术变革与创业机遇,对话阿里云百炼负责人

十字路口播客关注新一代 AI 技术浪潮带来的行业变化和创业机会,寓意科技与人文的交汇。本期嘉宾是阿里云百炼的研发负责人于文渊,介绍阿里云百炼是中国最大的 MaaS 服务商之一。于文渊向听众问好,并表达了对 Koji 邀请的感谢。

01:09

阿里云百炼负责人快问快答:年龄、学历、MBTI 与加入阿里前的经历

阿里云百炼负责人于文渊进行快问快答,透露自己 39 岁,毕业于北京大学和爱丁堡大学,MBTI 是 INTP。加入阿里前,于文渊在 2018 年创立了一家小公司,后被阿里收购,主要从事图计算相关工作,并在达摩院和通讯实验室工作。Claude Code 和 OpenClaw 的出现,Token 数迅速增长,大家将 AI 融入到生产力场景中。AI 正在深刻地改变大家使用算力的方式,未来三五年,大量人力工作会被 AI 替代,云计算的数据中心、调度系统等将发生巨大变化。

Part 2: 云计算变革与算力挑战

03:31

云计算格局重塑:新云涌现与阿里云的变革应对

云计算格局面临重新洗牌的趋势,好用的云的标准也在变化。阿里云作为中国最大的云计算厂商,关注用户是否会转变为 agent,以及 agent 对计算、存储、网络和算力的需求。阿里云关注安全,用户量、操控量和算力需求都在快速增长。千问 3.5 周期发布后,峰值迅速达到历史新高,对算力的需求依然很高。OpenClaw 和 Claude Code 加速了增长,尤其是在 Agent 场景下。

05:25

算力挑战:GPU 资源有限与 Token 质量的重要性

在快速增长的背景下,阿里云面临着追求稳定性的挑战,尤其是在 GPU 供给有限的情况下,需要让每个 GPU 发挥最大作用。阿里云希望用户能享受到极致的弹性和稳定性,通过 API 调用中国最大的算力集群。Token 数量并非唯一关注点,Token 的质量也很重要,不同模型的 Token 价值不等同。每天消耗一亿 Token 的用户数量正在增加,可能需要提高 “一亿 Token 俱乐部” 的门槛。

07:59

阿里云百炼关注峰值调研、技术消耗填补与 GPU 充分利用

阿里云百炼除了 Token 外,还关注峰值调研、技术消耗填补、GPU 充分利用、服务质量(包括首包延时和生成速度)。国际化是重要方向,但国内业务发展速度更快,阿里云拥抱国际化,希望做好国际化。阿里云百炼可以看到各赛道、领域和场景的 Token 使用情况,例如经销商通过机器人以自然语言方式补货。

Part 3: MaaS 服务优势与企业选择

09:57

大模型替代人工:云服务厂商 MaaS 差异化竞争优势

大模型正在替代人工,未来许多行业角色可能受到影响。各云服务厂商都推出了 MaaS 服务,但存在差异化。阿里云的技术设施、产品线广泛、技术厚度以及达摩院提供的模型是其优势。这些模型不是黑盒模型,而是与阿里云背靠背一起开发。此外,阿里云还有自研芯片团队平头哥,提供良好的开发体验和效率。阿里云可以端到端地做大模型。

11:39

阿里云千问模型优势:精度体系、稳定性与 API 性能

在百炼上调用千问模型与其他平台相比具有独特优势,客户反馈千问模型的效果、质量和速度更好。阿里云积累了较多的精度体系和稳定性体系的推理服务框架,可以保证千问所有模型的 model card 上的分数都能通过百炼的 API 实现。于文渊认为,没有任何情况下企业需要自建模型,专业的人应该做专业的事。

12:51

MaaS vs. 自建:成本、安全与灵活性的深度剖析

企业自建模型通常出于成本可控、安全和灵活性的考虑,但于文渊认为 MaaS 可以更好地满足这些需求。从成本角度看,MaaS 能更好地进行推理优化,平衡服务质量和成本。在安全方面,云厂商绝对可信,且有看不到用户数据的机密推理方式。从灵活性上,MaaS 更具优势,能适应 AI 和模型快速变化的需求。

Part 4: AI 编程、代码质量与人才建议

15:21

计算机专业学习建议:不要过度依赖 AI 写代码,重视基础与判断力

于文渊建议大家继续学习计算机专业,并引用 “要么被计算机使用,要么使用计算机” 的观点。他建议计算机专业的学生不要过度依赖 AI 写代码,要避免与 AI 高度重合,而要成为能识别 AI 做不到的 1% 的人。他用医生使用 AI 的例子说明,实习医生直接依赖 AI 会找不到 AI 的问题,缺乏经验积累和判断力。

17:30

AI 代码质量反思:Code Review 与生产环境的挑战

AI 生成的代码在 Code Review 中常被发现问题,Vibe Coding 在生产环境中的应用仍有差距。在压力下,AI 代码容易暴露问题。生产可用的代码需要保证每一行都能完成预期功能,且副作用可接受。AI 对上下文和深度理解不足,Mission Critical 的代码暂时不能依赖 AI。

19:21

Spec Coding:清晰规范与 AI 代码生成的未来

Spec coding 是较好的方式,需要编写清晰的需求文档或规范。通过清晰的 spec,AI 可以高质量地完成文件系统等底层代码的编写。人需要用形式化的逻辑描述清楚想要的东西,AI 才能做好填空。于文渊不鼓励企业将 AI 生成代码比例作为目标,因为这很危险。人和人之间的合作交流中有很多隐性知识,AI 难以干涉。

21:17

过程知识的重要性:AI 替代与工程师能力点的坚守

过程知识很重要,将事物做出来需要生产要素、知识要素和过程要素。程序员需要将自己的能力点立在 AI 做不到的点上,坚守住自己的 0.1。AI 可能真正能替代的是写最好的那些人,例如写操作系统内核、数据库内核、文件系统的人。与人走得越近的东西,越难被取代。系统工程师因为要与物件系统启用,反而更容易被取代。

Part 5: 行业供给、国产芯片与算力未来

23:33

MaaS 系统工程师:开放问题与英伟达断供的影响

于文渊认为 MaaS 系统工程师是一个开放问题,因为 AI 变化太快,需要的是人的潜力,而不是知识。英伟达断供对中国 AI 发展影响很大。算力像石油,关键在于供给是否匹配需求。中国能做自主可控,但油田没开采的情况下,下游高速工厂的车已经跑起来了,算力供给缺口会影响中国 AI 发展。

25:23

国产芯片的信心与算力饥渴:前所未有的状态

于文渊对国产算力非常有信心,平头哥做得非常好。英伟达是事实标准,有很强的软硬件团队。MaaS 或算力 AI 的发展不取决于产品做得好不好,而是总量供给的问题。只要有算力,就能让市场消耗掉,让 AI 应用变得便宜。对算力的饥渴是一个前所未有的状态。

Part 6: 场景预测与行业终局

27:17

未来 Token 消耗场景预测与阿里云百炼的价值

于文渊预测 Agent 和 AI 生成将是未来 Token 消耗的主要场景。阿里云百炼的价值在于提供好的体验、低的成本、好的模型效果和容量,将算力高效地转化为 Token。千问的 API 就是百炼的 API,谁能更高效地转换算力,谁就更有优势。

28:36

阿里云百炼模型选择与 Neocloud 的未来

百炼作为一个娱乐平台,服务客户的需求,可以使用千问之外的其他模型。百炼托管部署中国的开源模型,用户可以使用百炼的 API 享受 minimax, akimi 和轨迹流动的 DeepSeek 的 API。于文渊不看好资源转售类的 Neocloud,更看好 AI 原生的,屏蔽硬件和复杂性的 MaaS,以及围绕 AI Agent 的公司或产品。

30:12

MaaS 终局:基础设施级的 Utility 与水电煤膜的未来

MaaS 的终局取决于 AI 在未来社会中承担的角色。AI 会是一个类似水电煤一样的 utility,成为基础设施。AI 的终局可能不是一个模型,而是像电一样,不分核电水电,插在头上就是 220 伏交流电。未来的基础设施会从水电煤变成水电煤膜,深远地影响日常生活。

Sign in to continue reading, translating and more.

Open full episode in Podwise