本期跨国串门计划播客克隆了 AWS 首席机器学习布道师 Suman Debnath 的技术分享,深入探讨了基于视觉的检索技术以及如何利用 Agent 框架构建智能应用。Suman 首先介绍了多模态 RAG 的三种方案,然后重点讲解了基于视觉的检索模型 Call Patcher,详细阐述了其工作原理和优势,并分享了实际应用案例。他还介绍了 Strands Agent 框架,展示了如何用它将整个工作流变成一个 Agent,并加上语音功能。在随后的问答环节,Suman 解答了听众关于该技术在生产环境中的应用、扩展性以及与其他技术的结合等问题,强调了根据数据特点选择合适技术的重要性。
Sign in to continue reading, translating and more.
Continue