多媒體處理

1 Article

多模態檢索系統影片音訊文書處理技術

本文探討如何建構多模態檢索系統,特別專注於影片中音訊和文字資料的處理技術。文章涵蓋使用 Faiss 建立向量資料函式庫儲存文字嵌入、MoviePy 抽取音訊片段,以及設計 RAG