多模態

1 Article

影片載入多模態檢索系統技術實踐

本文介紹如何將影片載入多模態檢索系統(RAG),包含影片分割、幀儲存、音訊轉錄、嵌入生成與儲存等步驟。利用 MoviePy 處理影片、Whisper 模型進行語音轉文字、GPT-4o 產生嵌入向量,最後儲存於向量資料函式庫,實作多模態檢索功能,提升影片資訊的搜尋效率與應用價值。