本期播客探讨了两个引人关注的话题。首先,我们讨论了大型语言模型如何应对英文口语练习资源不足的问题,特别是 Speak App 如何利用 AI 提供个性化的口语练习和反馈。其次,我们深入分析了 State Space Model (SSM) 这一神经网络架构的潜力及其最新进展。SSM 有望解决 Transformer 在计算复杂度方面的挑战,未来可能取而代之,成为主流架构,尤其在音频和视频处理上展现出独特优势,更适合边缘计算。AI21Labs 的 Jamba 和 Cartesia 的 Sonic 是 SSM 成功应用的典范。