如果說數(shu)(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)產生和(he)收集(ji)是基(ji)礎,那么數(shu)(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)挖掘、分析(xi)和(he)利用則是關鍵。簡單來(lai)說,數(shu)(shu)(shu)據(ju)挖掘就是要從(cong)大(da)量(liang)非結構(gou)化(hua)(hua)數(shu)(shu)(shu)據(ju)和(he)半(ban)結構(gou)化(hua)(hua)數(shu)(shu)(shu)據(ju)中挖掘出隱含的(de)(de)(de)(de)(de)(de)(de)、先前未知但潛在(zai)有(you)效(xiao)的(de)(de)(de)(de)(de)(de)(de)信息(xi)和(he)模式的(de)(de)(de)(de)(de)(de)(de)一(yi)(yi)個工(gong)程(cheng)(cheng)化(hua)(hua)和(he)系統化(hua)(hua)的(de)(de)(de)(de)(de)(de)(de)過(guo)程(cheng)(cheng)。在(zai)大(da)數(shu)(shu)(shu)據(ju)時代之前,抽樣(yang)調查是獲(huo)取信息(xi)的(de)(de)(de)(de)(de)(de)(de)主要途徑,樣(yang)本(ben)的(de)(de)(de)(de)(de)(de)(de)數(shu)(shu)(shu)量(liang)和(he)質量(liang)很容易影響調查結果;而(er)大(da)數(shu)(shu)(shu)據(ju)時代意味著一(yi)(yi)個全樣(yang)本(ben)時代的(de)(de)(de)(de)(de)(de)(de)來(lai)臨,可(ke)以對(dui)全樣(yang)本(ben)進行(xing)深度(du)學(xue)習來(lai)精準回答(da)問題,把握用戶(hu)的(de)(de)(de)(de)(de)(de)(de)真(zhen)實想法和(he)習慣。這就意味著,在(zai)算法、機器學(xue)習、知識圖譜等(deng)技術的(de)(de)(de)(de)(de)(de)(de)幫助下對(dui)數(shu)(shu)(shu)據(ju)進行(xing)專業性(xing)地挖掘和(he)處理,進而(er)通(tong)過(guo)數(shu)(shu)(shu)據(ju)加工(gong)將(jiang)之變成具(ju)有(you)針(zhen)對(dui)性(xing)的(de)(de)(de)(de)(de)(de)(de)有(you)效(xiao)信息(xi),能夠幫助我們(men)實現(xian)智(zhi)能化(hua)(hua)的(de)(de)(de)(de)(de)(de)(de)信息(xi)收集(ji)和(he)加工(gong),大(da)數(shu)(shu)(shu)據(ju)仍然(ran)是人工(gong)智(zhi)能的(de)(de)(de)(de)(de)(de)(de)基(ji)礎。
人(ren)工智能(neng)的(de)(de)核心是機(ji)(ji)器學(xue)習,其他人(ren)工智能(neng)技術(shu)基本上都在它(ta)的(de)(de)基礎上發(fa)展(zhan)和進(jin)化(hua)。簡單來(lai)說,機(ji)(ji)器學(xue)習就是計算(suan)機(ji)(ji)模仿(fang)人(ren)類的(de)(de)學(xue)習過程和學(xue)習行為,從(cong)以往的(de)(de)數據(ju)或經驗中獲取新的(de)(de)知識(shi)或技能(neng),優化(hua)自身性能(neng),并對(dui)未來(lai)進(jin)行預測。傳統的(de)(de)機(ji)(ji)器學(xue)習在指紋識(shi)別(bie)、人(ren)臉(lian)檢測、物體(ti)檢測等領(ling)域(yu)的(de)(de)應(ying)用已經比較(jiao)成(cheng)熟,但面對(dui)大規(gui)模數據(ju)卻(que)一籌莫展(zhan),直(zhi)到(dao)深度學(xue)習的(de)(de)出(chu)現。
深度(du)學習起源于人(ren)(ren)(ren)工神經網絡,它無需人(ren)(ren)(ren)工指導(dao),利用(yong)海量(liang)數據(ju)自(zi)動進行(xing)(xing)自(zi)我訓練,從(cong)而構建相(xiang)關(guan)模型來學習特征數據(ju),它能(neng)夠發現(xian)大數據(ju)中的(de)復雜結(jie)構。比如調用(yong)了一千(qian)萬段(duan)YouTube視頻(pin)中的(de)圖(tu)片來針對(dui)計算(suan)機進行(xing)(xing)訓練,讓神經網絡識別貓(mao)。相(xiang)反,在遇到小(xiao)樣本問題的(de)時候,使用(yong)人(ren)(ren)(ren)工指定規則的(de)傳(chuan)統機器(qi)學習的(de)性(xing)價(jia)比則更高。作為(wei)一種基礎性(xing)技術驅動力,機器(qi)學習和(he)(he)深度(du)學習是智能(neng)媒介快速進化和(he)(he)升級的(de)必然條件。