影象檢索系統

共有1項相關記錄
使用SigLIP 2提升影象搜尋能力精選圖片
使用SigLIP 2提升影象搜尋能力
SigLIP 2(用於語言影象預訓練的 Sigmoid Loss)是谷歌 DeepMind 開發的最先進的多語言視覺語言編碼器,有望徹底改變我們處理影象相似性和搜尋任務的方式。它的創新架構不僅提高了語義理解能力,而且在零鏡頭分類和影象-文字檢索方面表現出色。SigLIP 2 採用統一的訓練方法,結合了自我監督學習和多樣化的資料整理,在提取有意義的視覺表徵方面優於以往的模型。