在本期的 AI 局内人播客中,我们邀请了生数科技的联合创始人兼 CTO 鲍凡,深入探讨视频生成技术的最新进展和商业化现状。重点介绍了生数科技刚发布的 Vidu 1.5 版本,这一版本在视频生成模型上取得了重要突破,特别是多图参考功能的实现,成功解决了视频生成中的一致性问题,并展现出类似 GPT 的 “智能涌现” 能力,能够理解多模态提示词并保持多个主体的一致性。鲍凡详细阐述了这一技术突破背后的转变,从以特定任务微调的 BERT 模式转向基于上下文学习的 GPT 模式。他还讨论了这项技术在推理速度、商业化应用及未来发展方向上的潜力,以及视频生成模型作为通向 AGI 的一种新路径的可能性。
Sign in to continue reading, translating and more.
Continue