l****n-作者主页-天翼云开发者社区

全部文章Ta的評論

多模態助力單模態，提高文本視頻檢索精度
本文介紹將多模態學習與視頻文本檢索相結合的SOTA模型，Table（TAgging Before aLignmEnt），通過引入多模態信息和在標簽域融合信息，有效提升本文視頻檢索的召回率。
AI
l****n
2024-05-21
86
0
具有選擇狀態空間的線性時間序列建模Mamba模型在多模態文本視頻檢索的應用
Mamba模型融合了CNN的并行處理優勢和RNN的長期記憶功能，有效改善了Transformer在長序列處理上的不足。與Transformer相比，Mamba更擅長提取視頻特征和構建幀間的全局聯系。雖然Mamba模型較新，在多模態視頻檢索領域的應用仍處于初步探索階段，但將其應用于文本和視頻的多模態檢索具有顯著的科研潛力。本研究基于文本視頻檢索的大模型CLIP4clip，探索使用Mamba模型替換CLIP模型中的Transformer架構，目的是對輸入向量進行更有效的信息建模。這一嘗試不僅展示了Mamba模型的實用性，也為未來的研究方向提供了新的視角。
AI 視頻直播視頻監控
l****n
2024-04-17
86
1
人臉檢測模型全面測評
SCRFD人臉檢測（Sample and Computation Redistribution for Efficient Face Detection）通過訓練數據采樣和計算分布策略，旨在提高人臉檢測的效率，主要目標是低延遲、低成本和高準確度。本文對SCRFD-10g模型進行了優化和全面評測，包括在WIDER FACE的Easy/Medium/Hard條件下的準確率評估，不同尺寸人臉框的檢測精度，口罩遮擋下的人臉檢測，不同光照和分辨率條件下的表現，關鍵點檢測精度，不同得分閾值對準確度的影響，以及低質量圖片下的人臉檢測效果。全面分析SCRFD-10g模型，評估其部署和應用潛力。
AI 人臉檢測大數據
l****n
2023-12-11
404
1

共 3 條前往

頁

沒有更多了

個人簡介

暫未填寫公司和職務

暫未填寫個人簡介

暫未填寫技能專長

暫未填寫畢業院校和專業

個人成就

共發表過 3 篇文章

文章獲得 2 次贊同

文章被瀏覽 576 次

獲得 0 人關注

個人榮譽查看規則

暫未獲得榮譽

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

活動

智算服務

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云