幾種常見的數據注釋類型
1.分類標注:分類標注是我們常用的標注。一般從已建立的標簽中選擇與數據對應的標簽,這是一個封閉集。一張圖片可以有很多類別/標簽:成人、女性、黃種人、長發等。對于單詞,可以標記主語、謂語、賓語、名詞動詞等。
適用:文本、圖像、語音和視頻
應用:人(ren)臉年齡(ling)識(shi)別,情(qing)感識(shi)別,性別識(shi)別
2.幀標記:機器視覺中的幀標記,簡單易懂,就是選擇要檢測的對象。比如人臉識別,首先要確定人臉的位置。比如行人識別等。
適用:圖像
應用:人臉識別,物體識別
3.面積標注:面積標注比盒子標注更準確。邊緣可以是柔性的。比如自動駕駛中的道路識別。
適用:圖像
應用:自動駕駛
4.點標記:在一些對特征有詳細要求的應用中,通常需要點標記。人臉識別,骨骼識別等。
適用:圖像
應用:人臉識別,骨骼識別
5.其他注解:除了以上常見的注解類型,還有很多個性化的注解。根據不同的需求需要不同的標注。如自動摘要,需要標注文章要點,此時的標注嚴格來說不屬于以上任何一項。(或者你也可以歸類為分類,但是沒有給要點貼標簽的客觀標準。如果是貼標簽,蘋果估計大部分人都有類似的貼標簽結果。)
數據標注器可以說是AI在剔除了一部分工作之后創造的一種工作。在未來AI發展好的前提下,數據差距肯定是巨大的。可以預測,3-5年內對數據標注器的需求將一直存在。
至于發展,其實有些所謂熟能生巧的工作是有被取代的風險的。深度學習解決的一個問題是熟能生巧。在這個位置上,其實你的一些想法代表了AI的一些想法,AI會根據你標注的數據來學習。想想也有點成就感。
數據標注可以說是AI的入門級崗位,以后可以轉到其他AI崗位。比如項目實施顧問等。這就需要更多的工作技能,需要在工作中積累幾倍的智慧。智成長科技自主研發,自主產權,牢記開拓精神和科學價值觀。圍繞不同需求自主研發第三方輔助分析和標注工具。
注釋工具支持各種注釋形式,如圖像、文本和視頻
圖像分類,矩形框,多邊形,曲線定位,3D定位
文本分類、文本實體標注、視頻跟蹤等。
可擴展插件設計
插件支持自定義標注,可以根據具體需求開發不同的標注形式
導出(chu)支持主(zhu)流(liu)數據集格式。
跨平臺(tai),多(duo)語(yu)言,兼容不(bu)同操作系統
支(zhi)(zhi)持Window/Mac/CentOS/Ubuntu,支(zhi)(zhi)持中/英(ying)文,滿(man)足(zu)所有(you)團(tuan)隊需求。