亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

  • 發布文章
  • 消息中心
點贊
收藏
評論
分享
原創

自動駕駛場景BEV和PV模型評測淺談

2024-08-06 09:36:29
682
0

1. 背景介紹

        自動駕(jia)(jia)駛技術是近年來汽車工業和(he)人(ren)工智能領域的(de)一(yi)個(ge)重要發(fa)展方向,它(ta)涉及到車輛的(de)感(gan)知、決策和(he)控制等(deng)多個(ge)方面。在(zai)自動駕(jia)(jia)駛系統中,場(chang)景理(li)解(jie)是一(yi)個(ge)基(ji)礎而關(guan)鍵的(de)步(bu)驟(zou),它(ta)幫(bang)助車輛理(li)解(jie)周圍環境(jing)并做(zuo)出相應的(de)反(fan)應。

        BEV(鳥瞰視圖)和(he)(he)PV(透(tou)視圖)是兩種不同的視角(jiao)模型,它們(men)在自(zi)動(dong)駕駛場(chang)景中被用來處理和(he)(he)解釋車輛(liang)周(zhou)圍的環境(jing)信息。BEV和(he)(he)PV模型在自(zi)動(dong)駕駛場(chang)景理解中扮演著重(zhong)要角(jiao)色(se),并(bing)且(qie)它們(men)的評測對于(yu)確保自(zi)動(dong)駕駛系統的安全(quan)性和(he)(he)有效性至關重(zhong)要。

2. BEV及PV模型技術原理

BEV模(mo)(mo)型(xing)和PV模(mo)(mo)型(xing)的基本概念如下:

  1. BEV模型:鳥瞰視圖模(mo)型提供了一個從上方觀察(cha)車(che)輛(liang)(liang)及其(qi)周圍(wei)環境(jing)的(de)視角(jiao)。這種(zhong)視角(jiao)有助(zhu)于(yu)車(che)輛(liang)(liang)更好(hao)地理解交通流和(he)車(che)輛(liang)(liang)的(de)位置關系,常用于(yu)路(lu)徑(jing)規劃和(he)避障。

  2. PV模型:透視圖模型則提供了一個更接近人類駕駛員視角的視圖,它模擬了車輛前方的視角,有助于車輛識別和理解道路上的交通標志、行人和其他車輛。      

BEV和PV都是(shi)自動(dong)(dong)駕(jia)駛領域進(jin)行(xing)多源信息(xi)融(rong)合的典型(xing)實現(xian)模型(xing),其中PV模型(xing)傾向(xiang)(xiang)于單獨進(jin)行(xing)推理,將(jiang)推理數據(ju)顯性(xing)化(hua)進(jin)行(xing)決(jue)策(ce),通常需要增加業務邏輯、先驗知識和處理規則來實現(xian);而BEV更(geng)傾向(xiang)(xiang)于在多源特征(zheng)圖層面進(jin)行(xing)深度融(rong)合(fusion),采(cai)用端(duan)到端(duan)學習方式實現(xian)決(jue)策(ce)任務。BEV模型(xing)在一定程度上減輕了模型(xing)對(dui)特定規則和先驗知識的依賴,近年來隨著Transformer類大(da)(da)模型(xing)+大(da)(da)數據(ju)能力提升(sheng),端(duan)到端(duan)學習具有更(geng)大(da)(da)的提升(sheng)潛力,BEV模型(xing)是(shi)目(mu)前(qian)自動(dong)(dong)駕(jia)駛領域研究熱點。
 

BEV(Bird's-Eye-View)感(gan)知領域涉及(ji)的細分任務類型主(zhu)要(yao)包括以下幾個(ge)方面:

1.  3D目標(biao)檢測(3D Object Detection):使用(yong)BEV視角進行目標檢測(ce),能夠(gou)更準確地識別和(he)定位場(chang)景中的對象。

2.  3D車道檢(jian)測(3D Lane Detection):檢(jian)測道路中(zhong)的(de)車道線,并在BEV視角下進行(xing)表示,這對于自動駕(jia)駛中(zhong)的(de)路徑(jing)規(gui)劃(hua)和控制至關重要。

3.  地(di)圖分(fen)割(Map Segmentation):對環(huan)境地圖進行像(xiang)素級別(bie)的(de)分割(ge),識別(bie)不同的(de)道路元素,如(ru)可行駛區域(yu)、人行道等。

4.  多目標跟(gen)蹤(Multi-Object Tracking, MOT):在(zai)BEV視角下跟(gen)蹤多個移動目(mu)標,這(zhe)對于理解動態環境和進行決策至關(guan)重要。

5.  運(yun)動(dong)預測(ce)(Motion Prediction):預測其他車輛(liang)和行人在(zai)未來一段時間內(nei)的運(yun)動軌(gui)跡,這對于自(zi)動駕駛中的安全決策非常重(zhong)要。

6.  場景理解(Scene Understanding):綜(zong)合理解整個交通場景(jing),包括(kuo)車(che)輛、行人、交通標志(zhi)等元素(su)的位置(zhi)和行為。

7.  傳感器(qi)融合(Sensor Fusion):將(jiang)來自不同傳感器(如攝像頭、激光(guang)雷達、雷達等)的數據融合到(dao)BEV視(shi)角中(zhong),以獲得更全面和準確的環境感知。

8.  自(zi)動駕(jia)駛挑(tiao)戰(Autonomous Driving Challenge):這是(shi)一(yi)個綜合性任務(wu),涉及上述所(suo)有任務(wu)類型,目的是(shi)在(zai)復雜的交通環(huan)境中實現自(zi)動駕(jia)駛。

9.  深度估(gu)計(ji)(Depth Estimation):在BEV視(shi)角中估(gu)計(ji)場(chang)景中各(ge)元(yuan)素的深度信息(xi),這對于3D目標檢測和場(chang)景理(li)解至關重要(yao)。

10.  特征(zheng)提(ti)取與建模(Feature Extraction and Modeling):在(zai)BEV視角(jiao)下(xia)提取和構(gou)建環境(jing)特(te)征(zheng)圖,用(yong)于識別和追蹤路面(mian)、車輛(liang)、行人、交通標志(zhi)等關鍵(jian)元素。

11.  端(duan)到(dao)端(duan)優化(End-to-End Optimization):最新的BEV感(gan)知(zhi)技術如LSS(Lift, Splat, Shoot)或BEVFormer等,實現了從原始(shi)傳感(gan)器輸入(ru)到BEV特征的生成,同時(shi)進(jin)行感(gan)知(zhi)任(ren)務的學習和(he)優(you)化。

       這些任(ren)務類型涵蓋了從基礎(chu)的(de)感(gan)知任(ren)務到(dao)復(fu)雜的(de)決策和(he)預(yu)測任(ren)務,體現了BEV感(gan)知在自動駕駛系統中的(de)廣(guang)泛應用和(he)重要性。

3. 評測數據集

       在自動駕駛領域,鳥瞰(kan)圖(Bird's-Eye-View,簡稱BEV)感(gan)(gan)知(zhi)(zhi)技(ji)術的發展離不開(kai)各種數據(ju)集(ji)的支持,這些數據(ju)集(ji)提(ti)供(gong)了豐富的傳感(gan)(gan)器(qi)數據(ju)和標注信息,用于訓(xun)練和評估BEV感(gan)(gan)知(zhi)(zhi)算(suan)法。根據(ju)提(ti)供(gong)的文獻內容,以下是一些主流的BEV感(gan)(gan)知(zhi)(zhi)數據(ju)集(ji):

1.  KITTI數據集:KITTI是(shi)一個(ge)早期的(de)自動(dong)駕(jia)駛(shi)數(shu)(shu)據集(ji)(ji),提供(gong)了7481張訓練(lian)圖(tu)像和(he)7518張測(ce)試(shi)圖(tu)像,用于(yu)3D目標(biao)檢測(ce)任(ren)務。它還包括由Velodyne激光(guang)掃(sao)描儀捕獲的(de)點云數(shu)(shu)據。KITTI數(shu)(shu)據集(ji)(ji)是(shi)第一個(ge)全(quan)面的(de)自動(dong)駕(jia)駛(shi)任(ren)務數(shu)(shu)據集(ji)(ji),引起(qi)了社區的(de)廣泛關注。

2.  Waymo開放數據(ju)集(Waymo Open Dataset):Waymo數(shu)(shu)據(ju)集(ji)1.3版本(ben)(ben)包含了798,202個(ge)(ge)訓練視(shi)頻(pin)序列,80,080個(ge)(ge)驗證序列和(he)(he)80,080個(ge)(ge)測試(shi)序列。每(mei)個(ge)(ge)序列包含5個(ge)(ge)激光雷達和(he)(he)5個(ge)(ge)視(shi)角的(de)(de)圖像(xiang)。Waymo數(shu)(shu)據(ju)集(ji)是大(da)規模(mo)和(he)(he)多樣化的(de)(de),并(bing)且隨著數(shu)(shu)據(ju)集(ji)版本(ben)(ben)的(de)(de)更新(xin)而(er)不(bu)斷發展(zhan)。Waymo開放挑戰賽每(mei)年都會定義(yi)新(xin)任(ren)務,鼓勵社(she)區解(jie)決(jue)這些問題。

3.  nuScenes數(shu)據(ju)集:nuScenes是一(yi)個(ge)(ge)大(da)規模自動駕駛數據(ju)集(ji),包含兩個(ge)(ge)城(cheng)市中的(de)1000個(ge)(ge)駕駛場景,其中850個(ge)(ge)用于(yu)訓練(lian)/驗證,150個(ge)(ge)用于(yu)測試。每個(ge)(ge)場景持(chi)續20秒,并提供了(le)包括6個(ge)(ge)攝像(xiang)頭(tou)、1個(ge)(ge)激(ji)光雷達和5個(ge)(ge)雷達的(de)完整傳感器套件(jian),以及相應(ying)的(de)高清(qing)地圖和CAN總線數據(ju)。

4.  Argoverse數(shu)據集(ji):Argoverse是第(di)一個(ge)帶有高清(qing)地圖(tu)的(de)自動駕駛數據集,包含2個(ge)激光雷(lei)達(da)、7個(ge)環視(shi)攝像(xiang)頭和(he)兩(liang)個(ge)立(li)體(ti)攝像(xiang)頭的(de)傳感器設置。Argoverse 1支持(chi)3D跟蹤和(he)運動預(yu)測任務(wu),而(er)更新的(de)Argoverse 2支持(chi)更多(duo)任務(wu),包括(kuo)3D目標檢(jian)測、無監督學習(xi)、運動預(yu)測和(he)地圖(tu)感知任務(wu)。

5.  其他數據集:文獻中還提到了(le)其他一些數(shu)據集,如ApolloScape、OpenLane、Lyft L5、A* 3D、H3D、SemanticKITTI、A2D2、Cityscapes 3D、PandaSet、KITTI-360、Cirrus、ONCE、AIODrive和DeepAccident等,這些數(shu)據集提供了(le)不同(tong)場景(jing)、不同(tong)傳(chuan)感器配置(zhi)和不同(tong)標注(zhu)類型(xing)的數(shu)據,用于支持BEV感知研(yan)究。

 這些(xie)數據集不僅為BEV感知算法的研(yan)究提供了豐富的實驗平臺,同時(shi)也推動了自動駕駛(shi)技術的發展。通過對這些(xie)數據集的深(shen)入分(fen)析和使用,研(yan)究人員能夠更好地理解BEV感知任務,并開發出(chu)更加精確和魯棒(bang)的算法。

4. 評測指標

BEV和PV感知的評測指標主要包括以下(xia)幾(ji)種:

1.  LET-3D-APL (Longitudinal Error Tolerant 3D Average Precision): 這是針對只有(you)攝(she)像頭的(de)3D檢測(ce)任務的(de)評估指(zhi)標。與傳統的(de)3D IoU(Intersection over Union)不同,LET-3D-APL允許預(yu)測(ce)的(de)邊界框在(zai)縱向(xiang)定(ding)位上有(you)一定(ding)的(de)誤差容忍度。它通過縮放精度值來(lai)懲罰縱向(xiang)定(ding)位誤差,從而考慮預(yu)測(ce)框與真(zhen)實(shi)框在(zai)縱向(xiang)上的(de)距離。

2.  mAP (mean Average Precision): 類似于(yu)2D目標(biao)檢測中眾(zhong)所周知的(de)AP(Average Precision)指標(biao),但匹(pi)配策(ce)略從(cong)IoU改(gai)為BEV平面(mian)上的(de)2D中心距離(li)。mAP在不同的(de)距離(li)閾(yu)值(zhi)下計(ji)算,通常是(shi)0.5米(mi)、1米(mi)、2米(mi)和4米(mi),然后計(ji)算這(zhe)些(xie)閾(yu)值(zhi)下AP的(de)平均值(zhi)。

3.  NDS (nuScenes Detection Score): nuScenes檢測分數是多(duo)個指標的組合(he),包括mAP、mATE(平(ping)(ping)均(jun)平(ping)(ping)移(yi)誤差(cha))、mASE(平(ping)(ping)均(jun)尺度誤差(cha))、mAOE(平(ping)(ping)均(jun)方(fang)向誤差(cha))、mAVE(平(ping)(ping)均(jun)速度誤差(cha))和mAAE(平(ping)(ping)均(jun)屬(shu)性(xing)誤差(cha))。NDS通過(guo)上(shang)述指標的加權和來計算(suan),其中(zhong)mAP的權重為5,其余為1。

4.  PKL (Planning KL-Divergence): PKL是一個用于(yu)神經網絡(luo)規劃(hua)任務(wu)的新(xin)指標(biao)(biao),基于(yu)規劃(hua)器(qi)生(sheng)成(cheng)的軌(gui)(gui)跡與真實軌(gui)(gui)跡之間的KL散度。PKL指標(biao)(biao)始(shi)終非負,較小的PKL得(de)分(fen)意味著檢測性能更(geng)好。

5.  Localization Affinity: 用于LET-3D-APL中的定(ding)(ding)(ding)位(wei)親(qin)(qin)和(he)度定(ding)(ding)(ding)義(yi),根據預測框(kuang)的縱向(xiang)定(ding)(ding)(ding)位(wei)誤差(cha)來調整(zheng)精(jing)度值(zhi)。如(ru)果沒有縱向(xiang)定(ding)(ding)(ding)位(wei)誤差(cha),則定(ding)(ding)(ding)位(wei)親(qin)(qin)和(he)度為1.0;如(ru)果誤差(cha)等于或超過最大縱向(xiang)定(ding)(ding)(ding)位(wei)誤差(cha),則為0.0;親(qin)(qin)和(he)度在0.0和(he)1.0之間(jian)線(xian)性(xing)插值(zhi)。

        這(zhe)些評估指標(biao)用于衡量BEV感(gan)知算法在不同方(fang)面的表現,包括目標(biao)檢測的準確(que)性、魯棒性以及與(yu)真實情況的接近程度。通(tong)過(guo)這(zhe)些指標(biao),研究人(ren)員可(ke)以全面地評估和比較不同BEV感(gan)知方(fang)法的性能(neng)。

 

 

0條評論
0 / 1000
呂****博
7文章數
2粉絲數
呂****博
7 文章 | 2 粉絲
呂****博
7文章(zhang)數
2粉(fen)絲數
呂****博
7 文章 | 2 粉絲
原創

自動駕駛場景BEV和PV模型評測淺談

2024-08-06 09:36:29
682
0

1. 背景介紹

        自動駕駛(shi)(shi)技術是近(jin)年來汽(qi)車(che)工業和(he)人(ren)工智能領域(yu)的(de)一(yi)個重要(yao)發展方向,它涉及到車(che)輛的(de)感知、決策和(he)控(kong)制等多個方面。在自動駕駛(shi)(shi)系統中,場景理解(jie)是一(yi)個基(ji)礎而關鍵的(de)步驟,它幫助(zhu)車(che)輛理解(jie)周圍(wei)環(huan)境并做出相應(ying)的(de)反應(ying)。

        BEV(鳥瞰(kan)視圖)和PV(透視圖)是兩種(zhong)不同的(de)視角模型(xing),它們在(zai)自(zi)動駕(jia)駛(shi)場(chang)景中被(bei)用來處(chu)理(li)和解釋(shi)車輛周圍的(de)環境信息。BEV和PV模型(xing)在(zai)自(zi)動駕(jia)駛(shi)場(chang)景理(li)解中扮演著重要角色,并且(qie)它們的(de)評(ping)測對于(yu)確(que)保(bao)自(zi)動駕(jia)駛(shi)系統的(de)安全性和有效性至關重要。

2. BEV及PV模型技術原理

BEV模(mo)型(xing)和PV模(mo)型(xing)的基本概念如下:

  1. BEV模型:鳥瞰視(shi)(shi)圖(tu)模(mo)型提供(gong)了(le)一個(ge)從上方(fang)觀(guan)察車輛(liang)及(ji)其周圍環境的視(shi)(shi)角。這種視(shi)(shi)角有助于車輛(liang)更(geng)好地(di)理解(jie)交通流和車輛(liang)的位置關系,常用于路徑規劃(hua)和避障。

  2. PV模型:透視圖模型則提供了一個更接近人類駕駛員視角的視圖,它模擬了車輛前方的視角,有助于車輛識別和理解道路上的交通標志、行人和其他車輛。      

BEV和(he)(he)(he)PV都是(shi)自動駕(jia)駛(shi)領域(yu)進行(xing)多源信息融(rong)合(he)的典(dian)型(xing)實(shi)現模型(xing),其(qi)中(zhong)PV模型(xing)傾(qing)向于單獨進行(xing)推理(li),將(jiang)推理(li)數據顯性(xing)化進行(xing)決策,通常需(xu)要(yao)增加(jia)業務邏(luo)輯、先驗知識和(he)(he)(he)處(chu)理(li)規則來實(shi)現;而BEV更傾(qing)向于在多源特征(zheng)圖層面進行(xing)深度融(rong)合(he)(fusion),采(cai)用端(duan)(duan)到端(duan)(duan)學習方式實(shi)現決策任(ren)務。BEV模型(xing)在一定(ding)程度上減輕了模型(xing)對特定(ding)規則和(he)(he)(he)先驗知識的依賴,近年來隨著Transformer類大模型(xing)+大數據能(neng)力(li)提(ti)升(sheng),端(duan)(duan)到端(duan)(duan)學習具有更大的提(ti)升(sheng)潛力(li),BEV模型(xing)是(shi)目前自動駕(jia)駛(shi)領域(yu)研究熱點。
 

BEV(Bird's-Eye-View)感知領域涉及(ji)的細分任(ren)務類(lei)型主要(yao)包括以下幾個(ge)方面(mian):

1.  3D目標檢(jian)測(3D Object Detection):使(shi)用BEV視(shi)角進行(xing)目標檢(jian)測,能夠更準(zhun)確地識別和定位場景中的對象。

2.  3D車道檢測(3D Lane Detection):檢測道路(lu)中的(de)車道線,并在BEV視角下進(jin)行表(biao)示,這對于自動駕駛中的(de)路(lu)徑規劃和(he)控制至關重要。

3.  地圖分割(Map Segmentation):對環境地圖進行像素級別的分(fen)割,識別不同的道路(lu)元素,如可(ke)行駛區域、人行道等。

4.  多目標跟蹤(Multi-Object Tracking, MOT):在BEV視角下跟蹤多(duo)個移動目(mu)標,這(zhe)對于理解動態環境(jing)和進行決策(ce)至關重要。

5.  運動預測(Motion Prediction):預測其他車輛和行人在未來一段時間內(nei)的(de)運動軌跡,這對于自(zi)動駕駛中的(de)安全(quan)決策非常重要。

6.  場景(jing)理解(jie)(Scene Understanding):綜合理解整(zheng)個交(jiao)通場景,包括車(che)輛、行人、交(jiao)通標志等(deng)元(yuan)素的(de)位置和行為(wei)。

7.  傳(chuan)感器(qi)融(rong)合(Sensor Fusion):將來自(zi)不(bu)同(tong)傳感(gan)器(如(ru)攝像(xiang)頭、激(ji)光雷(lei)達、雷(lei)達等)的數(shu)據融合到BEV視角中(zhong),以獲得更全面(mian)和準確的環境感(gan)知。

8.  自動駕駛挑戰(Autonomous Driving Challenge):這是(shi)一個(ge)綜合性(xing)任(ren)務(wu),涉及上(shang)述(shu)所有任(ren)務(wu)類型,目的(de)是(shi)在復雜的(de)交通環(huan)境中實現自動駕駛。

9.  深(shen)度(du)估計(Depth Estimation):在BEV視角中(zhong)估計場(chang)景(jing)中(zhong)各元(yuan)素的深度信息(xi),這(zhe)對于3D目標檢測和場(chang)景(jing)理解至(zhi)關重(zhong)要。

10.  特征提取與(yu)建模(mo)(Feature Extraction and Modeling):在BEV視(shi)角下提取和構建環(huan)境(jing)特征圖(tu),用于識別(bie)和追蹤路(lu)面、車輛、行(xing)人、交通標志(zhi)等關鍵元素。

11.  端(duan)到端(duan)優化(End-to-End Optimization):最新的(de)(de)BEV感(gan)(gan)知技術(shu)如LSS(Lift, Splat, Shoot)或BEVFormer等,實(shi)現了從原始(shi)傳感(gan)(gan)器輸(shu)入到BEV特征的(de)(de)生成,同時(shi)進行(xing)感(gan)(gan)知任(ren)務的(de)(de)學(xue)習(xi)和優(you)化(hua)。

       這(zhe)些任務類(lei)型涵蓋了從基礎的(de)感知(zhi)任務到復雜的(de)決策和預測任務,體(ti)現(xian)了BEV感知(zhi)在自動駕駛系統中的(de)廣泛應用和重要(yao)性。

3. 評測數據集

       在自動駕(jia)駛領域,鳥(niao)瞰圖(Bird's-Eye-View,簡稱BEV)感知(zhi)技(ji)術(shu)的(de)(de)發展離不(bu)開各種數據(ju)集的(de)(de)支持,這些數據(ju)集提供了豐富(fu)的(de)(de)傳感器數據(ju)和(he)標(biao)注信息,用(yong)于訓練(lian)和(he)評估BEV感知(zhi)算法(fa)。根據(ju)提供的(de)(de)文獻內容,以下是一些主流的(de)(de)BEV感知(zhi)數據(ju)集:

1.  KITTI數(shu)據(ju)集:KITTI是一個早期的(de)(de)自動(dong)駕駛數(shu)據(ju)集(ji),提供了7481張訓練圖像和7518張測試圖像,用于(yu)3D目標檢測任(ren)務(wu)(wu)。它還包括由(you)Velodyne激光掃(sao)描(miao)儀捕獲(huo)的(de)(de)點(dian)云(yun)數(shu)據(ju)。KITTI數(shu)據(ju)集(ji)是第一個全(quan)面的(de)(de)自動(dong)駕駛任(ren)務(wu)(wu)數(shu)據(ju)集(ji),引起(qi)了社(she)區的(de)(de)廣泛關注。

2.  Waymo開(kai)放數據集(Waymo Open Dataset):Waymo數據(ju)(ju)集(ji)1.3版本包含了798,202個(ge)訓練視(shi)頻序(xu)列,80,080個(ge)驗(yan)證序(xu)列和(he)80,080個(ge)測試(shi)序(xu)列。每個(ge)序(xu)列包含5個(ge)激光雷達(da)和(he)5個(ge)視(shi)角的(de)(de)圖像。Waymo數據(ju)(ju)集(ji)是大規模(mo)和(he)多樣化的(de)(de),并且(qie)隨(sui)著數據(ju)(ju)集(ji)版本的(de)(de)更新(xin)而(er)不斷發展。Waymo開放挑(tiao)戰賽(sai)每年都會(hui)定義(yi)新(xin)任(ren)務,鼓勵(li)社區解決這(zhe)些問題。

3.  nuScenes數據集:nuScenes是一個(ge)(ge)(ge)大規(gui)模自動駕駛數據(ju)集(ji),包含兩個(ge)(ge)(ge)城市中的1000個(ge)(ge)(ge)駕駛場(chang)景,其中850個(ge)(ge)(ge)用于訓練/驗證(zheng),150個(ge)(ge)(ge)用于測試。每個(ge)(ge)(ge)場(chang)景持續20秒,并提(ti)供了包括(kuo)6個(ge)(ge)(ge)攝像頭、1個(ge)(ge)(ge)激光雷(lei)達和5個(ge)(ge)(ge)雷(lei)達的完整傳感器(qi)套件,以及相應的高清地圖和CAN總線數據(ju)。

4.  Argoverse數據(ju)集:Argoverse是第一個(ge)(ge)帶有高清(qing)地圖(tu)的自動駕駛數據集,包(bao)含2個(ge)(ge)激光雷達、7個(ge)(ge)環(huan)視攝(she)像頭和(he)兩個(ge)(ge)立體攝(she)像頭的傳感器設置。Argoverse 1支(zhi)持3D跟蹤(zong)和(he)運動預測任務,而更(geng)新的Argoverse 2支(zhi)持更(geng)多(duo)任務,包(bao)括3D目(mu)標(biao)檢測、無監(jian)督學(xue)習、運動預測和(he)地圖(tu)感知任務。

5.  其他數(shu)據(ju)集:文獻中(zhong)還提(ti)到了(le)其他一些(xie)數(shu)(shu)據(ju)集,如ApolloScape、OpenLane、Lyft L5、A* 3D、H3D、SemanticKITTI、A2D2、Cityscapes 3D、PandaSet、KITTI-360、Cirrus、ONCE、AIODrive和DeepAccident等,這些(xie)數(shu)(shu)據(ju)集提(ti)供了(le)不(bu)同(tong)場景、不(bu)同(tong)傳感器配置和不(bu)同(tong)標注類型的數(shu)(shu)據(ju),用于支持BEV感知研究。

 這(zhe)些(xie)數據(ju)集不僅為BEV感(gan)知算法的(de)研(yan)究提供了豐富的(de)實驗平臺(tai),同時(shi)也推動了自動駕駛技(ji)術的(de)發展(zhan)。通過(guo)對這(zhe)些(xie)數據(ju)集的(de)深(shen)入分析(xi)和使(shi)用(yong),研(yan)究人(ren)員能(neng)夠更好地理(li)解BEV感(gan)知任(ren)務(wu),并開發出更加精確和魯棒的(de)算法。

4. 評測指標

BEV和(he)PV感(gan)知(zhi)的評測指(zhi)標主(zhu)要(yao)包括以下幾(ji)種:

1.  LET-3D-APL (Longitudinal Error Tolerant 3D Average Precision): 這(zhe)是針對只有(you)攝像頭的(de)(de)3D檢(jian)測(ce)(ce)任務(wu)的(de)(de)評估指標。與(yu)傳統的(de)(de)3D IoU(Intersection over Union)不同,LET-3D-APL允(yun)許預(yu)測(ce)(ce)的(de)(de)邊(bian)界框在縱向(xiang)定(ding)(ding)位上(shang)有(you)一定(ding)(ding)的(de)(de)誤(wu)差容忍度。它(ta)通過縮放(fang)精度值來懲罰(fa)縱向(xiang)定(ding)(ding)位誤(wu)差,從而考慮(lv)預(yu)測(ce)(ce)框與(yu)真實框在縱向(xiang)上(shang)的(de)(de)距離。

2.  mAP (mean Average Precision): 類似于(yu)2D目(mu)標檢(jian)測(ce)中(zhong)眾所周知(zhi)的AP(Average Precision)指(zhi)標,但匹配策(ce)略(lve)從IoU改為BEV平面上的2D中(zhong)心(xin)距(ju)離。mAP在不同的距(ju)離閾值(zhi)下(xia)計(ji)算(suan),通(tong)常是0.5米、1米、2米和4米,然(ran)后計(ji)算(suan)這些(xie)閾值(zhi)下(xia)AP的平均值(zhi)。

3.  NDS (nuScenes Detection Score): nuScenes檢測分數是多個指標的組(zu)合(he),包括(kuo)mAP、mATE(平(ping)均(jun)平(ping)移(yi)誤差(cha)(cha))、mASE(平(ping)均(jun)尺度誤差(cha)(cha))、mAOE(平(ping)均(jun)方向(xiang)誤差(cha)(cha))、mAVE(平(ping)均(jun)速度誤差(cha)(cha))和mAAE(平(ping)均(jun)屬性(xing)誤差(cha)(cha))。NDS通過上述指標的加權和來(lai)計算,其中mAP的權重為5,其余為1。

4.  PKL (Planning KL-Divergence): PKL是一個用(yong)于(yu)神經網絡規(gui)劃(hua)(hua)任(ren)務(wu)的新指(zhi)標,基于(yu)規(gui)劃(hua)(hua)器生成(cheng)的軌跡與真實(shi)軌跡之間的KL散度(du)。PKL指(zhi)標始終非負,較小的PKL得分(fen)意味(wei)著檢測性能更好。

5.  Localization Affinity: 用于(yu)LET-3D-APL中的(de)定位親和(he)度(du)定義,根據預測框的(de)縱向定位誤(wu)(wu)差(cha)來(lai)調整(zheng)精度(du)值。如果沒(mei)有縱向定位誤(wu)(wu)差(cha),則定位親和(he)度(du)為(wei)1.0;如果誤(wu)(wu)差(cha)等于(yu)或超過最(zui)大縱向定位誤(wu)(wu)差(cha),則為(wei)0.0;親和(he)度(du)在0.0和(he)1.0之間線性(xing)插值。

        這些(xie)評(ping)估(gu)指(zhi)標用于(yu)衡量(liang)BEV感知算法在不(bu)(bu)同方面的表(biao)現,包括目標檢測的準(zhun)確(que)性(xing)、魯棒(bang)性(xing)以及與真(zhen)實情況的接近程度。通過(guo)這些(xie)指(zhi)標,研究人員可以全面地評(ping)估(gu)和(he)比較不(bu)(bu)同BEV感知方法的性(xing)能。

 

 

文章來自個人專欄
文(wen)章 | 訂閱
0條評論
0 / 1000
請輸入你的評論
0
0