全部文章Ta的評論
- 本文介紹將多模態學習與視頻文本檢索相結合的SOTA模型,Table(TAgging Before aLignmEnt),通過引入多模態信息和在標簽域融合信息,有效提升本文視頻檢索的召回率。l****n2024-05-21860
- Mamba模型融合了CNN的并行處理優勢和RNN的長期記憶功能,有效改善了Transformer在長序列處理上的不足。與Transformer相比,Mamba更擅長提取視頻特征和構建幀間的全局聯系。雖然Mamba模型較新,在多模態視頻檢索領域的應用仍處于初步探索階段,但將其應用于文本和視頻的多模態檢索具有顯著的科研潛力。本研究基于文本視頻檢索的大模型CLIP4clip,探索使用Mamba模型替換CLIP模型中的Transformer架構,目的是對輸入向量進行更有效的信息建模。這一嘗試不僅展示了Mamba模型的實用性,也為未來的研究方向提供了新的視角。l****n2024-04-17861
- SCRFD人臉檢測(Sample and Computation Redistribution for Efficient Face Detection)通過訓練數據采樣和計算分布策略,旨在提高人臉檢測的效率,主要目標是低延遲、低成本和高準確度。本文對SCRFD-10g模型進行了優化和全面評測,包括在WIDER FACE的Easy/Medium/Hard條件下的準確率評估,不同尺寸人臉框的檢測精度,口罩遮擋下的人臉檢測,不同光照和分辨率條件下的表現,關鍵點檢測精度,不同得分閾值對準確度的影響,以及低質量圖片下的人臉檢測效果。全面分析SCRFD-10g模型,評估其部署和應用潛力。l****n2023-12-114041
共 3 條
- 1
頁
沒有更多了
個人簡介
暫未填寫公司和職務
暫未填寫個人簡介
暫未填寫技能專長
暫未填寫畢業院校和專業
個人成就
共發表過 3 篇文章
文章獲得 2 次贊同
文章被瀏覽 576 次
獲得 0 人關注
個人榮譽查看規則
暫未獲得榮譽