亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

點贊

評論

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】

2022-06-28 07:27:08

235

目前為止，我們知(zhi)道了海量數(shu)據(ju)(ju)的(de)(de)存儲是使用(yong)數(shu)據(ju)(ju)倉(cang)庫，而(er)為了保(bao)證數(shu)據(ju)(ju)的(de)(de)質量呢(ni)，我們要有元數(shu)據(ju)(ju)管理，還有數(shu)據(ju)(ju)治理。而(er)為了保(bao)證這些數(shu)據(ju)(ju)的(de)(de)性(xing)能、還有使用(yong)的(de)(de)效率(lv)等(deng)等(deng)，那(nei)么(me)我們采取的(de)(de)是分(fen)層架(jia)構。

<i id='9BupX'></i>

在目(mu)前市(shi)面上(shang)(shang)用的比較廣泛的數據倉庫是(shi)Hive，而Hive又(you)是(shi)依存于Hadoop這樣一個開源的分布(bu)式計算平臺上(shang)(shang)。所以本篇博客我們就來介紹一下Hadoop。

Hadoop概述

1 Hadoop簡介

Hadoop是什(shen)么(me)？簡單來說，Hadoop就是解決(jue)?數據(ju)時代(dai)下海量(liang)數據(ju)的(de)存儲和分析(xi)計算(suan)問題。

Hadoop不(bu)是(shi)指具(ju)體的(de)(de)(de)(de)?個框架或者組件，它是(shi)Apache軟件基?會下?Java語?開(kai)發的(de)(de)(de)(de)?個開(kai)源分布(bu)式(shi)計算(suan)(suan)平臺，實現在?量計算(suan)(suan)機(ji)組成的(de)(de)(de)(de)集群中(zhong)對海量數(shu)據(ju)進?分布(bu)式(shi)計算(suan)(suan)，適(shi)合(he)?數(shu)據(ju)的(de)(de)(de)(de)分布(bu)式(shi)存儲和計算(suan)(suan)，從?有效彌補了傳統數(shu)據(ju)庫在海量數(shu)據(ju)下的(de)(de)(de)(de)不(bu)?。

2 Hadoop優點

?可靠(kao)性：Hadoop按位存儲和(he)處理(li)數據的能?值(zhi)得?們信(xin)賴(lai)。

?擴(kuo)展性(xing)：Hadoop是在(zai)可?的(de)計(ji)算(suan)機集群間(jian)分配數(shu)據并(bing)完成計(ji)算(suan)任(ren)務，這些集群可以(yi)?便地擴(kuo)展到數(shu)以(yi)千計(ji)的(de)節點中。

?效性：Hadoop能夠(gou)在節(jie)點之間動態地移動數據，并保(bao)持各個節(jie)點的動態平(ping)衡，因(yin)此處理(li)速度?常快。

?容錯性(xing)：Hadoop能夠?動保存數據的(de)多個(ge)(ge)副(fu)本，并且(qie)能夠?動將失敗的(de)任務重新(xin)分配（比如(ru)一個(ge)(ge)計(ji)算(suan)機出現(xian)故障了，那有其(qi)他副(fu)本的(de)計(ji)算(suan)機會重新(xin)進行(xing)工作，也就是說它這個(ge)(ge)容錯性(xing)是很高的(de)。）。

低成本：Hadoop是(shi)開源的(de)，項?的(de)軟件成本因?得(de)以??降低。

3 Hadoop?態圈

我們再來看一(yi)下Hadoop的生(sheng)態圈，它的核心組(zu)件(jian)是(shi)HDFS，還(huan)有(you)MapReduce。那隨(sui)著處理任務(wu)的多(duo)樣性(xing)，Hadoop生(sheng)態圈它的組(zu)件(jian)會越來越多(duo)。

3.1 分布式存儲(HDFS)

HDFS就是將?件切分成固定??的(de)數據塊block(?件嚴(yan)格按照字節來切，所(suo)以若是最后切得省?點(dian)(dian)點(dian)(dian)，也算單獨?塊，hadoop2.x默(mo)認的(de)固定??是128MB，不同版本,默(mo)認值不同.可(ke)以通過(guo)Client端上傳?件設置)。

它主要是(shi)負責(ze)分(fen)布式存儲(chu)的，它把(ba)一(yi)個(ge)大文件切割成(cheng)(cheng)不同的小塊(kuai)，然后存儲(chu)在相(xiang)應的節點上(shang)(shang)，也就(jiu)是(shi)計算機上(shang)(shang)。默認情況下呢它是(shi)把(ba)這個(ge)塊(kuai)分(fen)成(cheng)(cheng)一(yi)百二十八兆，當文件大于一(yi)百二十八兆的時候(hou)，它就(jiu)會進行切割。

舉個(ge)例子(zi)(zi)（如圖(tu)），假(jia)如我現在(zai)有一個(ge)文件是二(er)百兆，那(nei)它就(jiu)切割了兩塊，分別放在(zai)不同的(de)(de)節(jie)點(dian)上(shang)。并且它對每一塊進行(xing)備(bei)份，默認(ren)情況下是三個(ge)部分（本身加兩個(ge)備(bei)份）。對于(yu)不同的(de)(de)副本，它是存(cun)儲在(zai)不同的(de)(de)節(jie)點(dian)上(shang)的(de)(de)，那(nei)下一個(ge)我們可(ke)以這樣算，也達到(dao)了這樣子(zi)(zi)的(de)(de)三塊。

也正(zheng)是因為HDFS的(de)這(zhe)樣一個分布(bu)式存儲，還有(you)(you)多副本的(de)備份(fen)，實現了Hadoop的(de)這(zhe)樣一個容錯性(xing)，還有(you)(you)就(jiu)是工作(zuo)量的(de)均衡。

那(nei)如果(guo)我們(men)把兩(liang)塊(kuai)都(dou)存在了一(yi)個(ge)節(jie)點(dian)上，那(nei)當對這個(ge)數據進行處(chu)理(li)的(de)時候，我們(men)可以第一(yi)塊(kuai)的(de)計(ji)算那(nei)是在節(jie)點(dian)1，那(nei)對于(yu)第二塊(kuai)的(de)計(ji)算，我們(men)就(jiu)到其他的(de)副(fu)本(ben)節(jie)點(dian)上計(ji)算，讓(rang)工作量保持(chi)均衡。

所(suo)以(yi)分(fen)布式存儲(chu)保證了(le)我們Hadoop系統的這(zhe)樣一個高容特(te)性(xing)，還有(you)高效性(xing)。

HDFS 的優點：

分布式存儲

?持分布式(shi)和(he)并?計算

?平可伸縮性

3.2 分布式計算(MapReduce)

MapReduce為海量的數據提供了計算。

MapReduce從它名(ming)字上(shang)來(lai)看就(jiu)(jiu)?致可以看出個(ge)緣由(you)，兩(liang)個(ge)動(dong)詞Map和Reduce，“Map（展開(kai)）”就(jiu)(jiu)是將?個(ge)任(ren)務(wu)分(fen)解(jie)成為多個(ge)任(ren)務(wu)，“Reduce”就(jiu)(jiu)是將分(fen)解(jie)后(hou)多任(ren)務(wu)處理的(de)(de)結果(guo)匯(hui)總(zong)起來(lai)，得出最(zui)后(hou)的(de)(de)分(fen)析結果(guo)。MapReduce采(cai)?"分(fen)?治之(zhi)"的(de)(de)思想，簡單地說(shuo)，MapReduce就(jiu)(jiu)是"任(ren)務(wu)的(de)(de)分(fen)解(jie)與結果(guo)的(de)(de)匯(hui)總(zong)"。

舉個(ge)例(li)子，當有(you)(you)了對剛(gang)才的(de)二百兆這(zhe)(zhe)個(ge)文件的(de)一個(ge)計(ji)算(suan)的(de)任務(wu)的(de)時候，那MapReduce會(hui)把我們的(de)這(zhe)(zhe)個(ge)任務(wu)分發給(gei)有(you)(you)這(zhe)(zhe)個(ge)塊(kuai)的(de)這(zhe)(zhe)樣一個(ge)節點，節點進行計(ji)算(suan)之后，然后他再整(zheng)合輸出。同理，也是因(yin)為(wei)MapReduce的(de)分布式計(ji)算(suan)保證了Hadoop的(de)高(gao)效性(xing)。

3.3 HBase

對于(yu)數(shu)據(ju)倉庫來說(shuo)(shuo)，它(ta)存儲(chu)的多數(shu)是(shi)(shi)歷史數(shu)據(ju)，不太(tai)支(zhi)持實時(shi)的這樣(yang)一個交(jiao)互(hu)。但(dan)是(shi)(shi)HBase它(ta)既(ji)存儲(chu)數(shu)據(ju)，也能和HDFS進行交(jiao)互(hu)，所以HBase存儲(chu)的數(shu)據(ju)是(shi)(shi)可(ke)以支(zhi)持實時(shi)的這樣(yang)一個交(jiao)互(hu)的，也就是(shi)(shi)說(shuo)(shuo)它(ta)可(ke)以用來完(wan)成MySQL、Oracle和SqlServer這樣(yang)業務(wu)型數(shu)據(ju)庫的功能，但(dan)是(shi)(shi)這樣(yang)使用的還是(shi)(shi)比較少的。

所以在業(ye)務系統中，數據需要實時交互的，我們還是采用傳統數據庫比較好(hao)一些。

3.4 Zookeeper

Zookeeper，主(zhu)要是對于我(wo)們的(de)數(shu)據平臺(tai)進行(xing)配置和(he)調度的(de)，主(zhu)要是用(yong)(yong)來解決分布式應(ying)用(yong)(yong)中經(jing)常遇到的(de)一些數(shu)據管理問題(ti)，例如統一命(ming)名、狀(zhuang)態同步等等。它的(de)目標就是封裝好復雜、易(yi)出錯的(de)相關服(fu)務，將(jiang)簡單、易(yi)用(yong)(yong)的(de)系(xi)統提供給用(yong)(yong)戶。

舉個例子，假設我(wo)們(men)的(de)(de)程(cheng)序是(shi)分(fen)布式部署在(zai)(zai)多(duo)臺(tai)(tai)機器(qi)上的(de)(de)，也(ye)就(jiu)(jiu)(jiu)是(shi)我(wo)們(men)每(mei)(mei)一臺(tai)(tai)機器(qi)上都有相應(ying)(ying)的(de)(de)應(ying)(ying)用(yong)程(cheng)序。但(dan)是(shi)我(wo)們(men)現在(zai)(zai)要(yao)(yao)更新，要(yao)(yao)改配置文(wen)件(jian)(jian)(jian)，那就(jiu)(jiu)(jiu)需要(yao)(yao)逐臺(tai)(tai)的(de)(de)來進行改變，這(zhe)樣(yang)就(jiu)(jiu)(jiu)比較麻(ma)煩。但(dan)是(shi)現在(zai)(zai)呢我(wo)們(men)把這(zhe)個配置文(wen)件(jian)(jian)(jian)全部放在(zai)(zai)Zookeeper上，存儲(chu)在(zai)(zai)Zookeeper上的(de)(de)某個目錄中(zhong)，然后相關的(de)(de)應(ying)(ying)用(yong)程(cheng)序，也(ye)就(jiu)(jiu)(jiu)是(shi)在(zai)(zai)每(mei)(mei)一臺(tai)(tai)機器(qi)上的(de)(de)應(ying)(ying)用(yong)程(cheng)序就(jiu)(jiu)(jiu)會監測(ce)Zookeeper。當Zookeeper上的(de)(de)配置文(wen)件(jian)(jian)(jian)發(fa)生變化了之后，就(jiu)(jiu)(jiu)會自動的(de)(de)進行下載、更新，這(zhe)樣(yang)我(wo)們(men)就(jiu)(jiu)(jiu)避免了每(mei)(mei)一臺(tai)(tai)機器(qi)都進行逐步的(de)(de)更改。

3.5 Pig Hive ChuKwa

Pig、Hive和ChuKwa屬于Hadoop生態(tai)圈的(de)(de)應用(yong)層(ceng)，主要都(dou)是對數據進行處(chu)理和分析的(de)(de)，只是不(bu)同的(de)(de)場(chang)景，選擇不(bu)同的(de)(de)組件會(hui)更好一些。

后期我會(hui)詳細介紹Hive，其他兩(liang)部分(fen)就暫(zan)時(shi)不介紹了(le)。

結束語

一直在學習路上！

————————————————

版(ban)權(quan)聲明：本文為CSDN博(bo)主(zhu)「報告(gao)，今天也有好好學(xue)習」的原創文章，遵(zun)循(xun)CC 4.0 BY-SA版(ban)權(quan)協議(yi)，轉載(zai)請(qing)附上原文出處鏈接(jie)及(ji)本聲明。

原文(wen)鏈接：//blog.csdn.net/qq_44186838/article/details/119942818

版(ban)權聲明：本(ben)文(wen)內容系天翼云實名用戶自發貢獻，版(ban)權歸原作者(zhe)所有，天翼云開發者(zhe)社區不擁有其著作權，亦(yi)不承(cheng)擔相(xiang)應法律責任，原文(wen)鏈接：//blog.csdn.net/qq_44186838/article/details/119942818

作(zuo)者：報告，今天也(ye)有好(hao)好(hao)學習，如需(xu)轉(zhuan)載，請(qing)聯系作(zuo)者。

原文出處及轉載信(xin)息見文內詳細說明，如有疑問或(huo)爭議，請聯系ctyunbbs@chinatelecom.cn刪除。

0條評論

0 / 1000

周****平

48文章數(shu)

2點贊(zan)數

3粉(fen)絲數

周****平

48 文(wen)章 | 3 粉(fen)絲(si)

Ta的熱門(men)文(wen)章查看更多

PostgreSQL：進程結構 PostgreSQL：psql 介紹 PostgreSQL：數據庫鏈接測試 PostgreSQL：啟動與停止達夢7數據庫初始化

周****平

48文章數

2點贊數

3粉絲數

周****平

48 文章 | 3 粉絲(si)

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】

大數據

2022-06-28 07:27:08

235

目(mu)前為止，我(wo)們知道了海量(liang)數(shu)(shu)(shu)(shu)據的存儲是(shi)使用數(shu)(shu)(shu)(shu)據倉庫(ku)，而為了保證數(shu)(shu)(shu)(shu)據的質(zhi)量(liang)呢，我(wo)們要有元數(shu)(shu)(shu)(shu)據管(guan)理(li)，還有數(shu)(shu)(shu)(shu)據治理(li)。而為了保證這些(xie)數(shu)(shu)(shu)(shu)據的性(xing)能、還有使用的效率等等，那(nei)么我(wo)們采取的是(shi)分層架構。

在目(mu)前市面(mian)上(shang)用的(de)比較廣泛的(de)數據倉庫是(shi)Hive，而Hive又(you)是(shi)依存于Hadoop這樣一個開(kai)源的(de)分布式計算平(ping)臺(tai)上(shang)。所以本篇博客我們就(jiu)來介紹一下(xia)Hadoop。

Hadoop概述

1 Hadoop簡介

Hadoop是什么？簡單(dan)來(lai)說，Hadoop就(jiu)是解決?數據時代下海量數據的存儲和分析計算問題。

Hadoop不是指具體的(de)?個框架或者組件，它是Apache軟件基?會下(xia)?Java語?開發的(de)?個開源分(fen)布(bu)式(shi)計(ji)算(suan)平臺，實(shi)現(xian)在?量計(ji)算(suan)機組成的(de)集(ji)群中對(dui)海量數據(ju)進(jin)?分(fen)布(bu)式(shi)計(ji)算(suan)，適合?數據(ju)的(de)分(fen)布(bu)式(shi)存儲和計(ji)算(suan)，從?有效彌(mi)補(bu)了傳統數據(ju)庫在海量數據(ju)下(xia)的(de)不?。

2 Hadoop優點

?可靠(kao)性：Hadoop按(an)位(wei)存儲和處(chu)理數據的(de)能?值得?們信(xin)賴。

?擴展性：Hadoop是在可?的(de)計算機(ji)集群間分配(pei)數據并完成計算任務，這些集群可以(yi)?便地(di)擴展到數以(yi)千計的(de)節點中。

?效(xiao)性：Hadoop能夠(gou)在節(jie)點之間(jian)動態地(di)移動數(shu)據(ju)，并保持(chi)各(ge)個(ge)節(jie)點的(de)動態平衡，因(yin)此處理速度?常快。

?容(rong)錯性：Hadoop能夠?動(dong)保存數據的(de)(de)多個(ge)副(fu)(fu)本(ben)，并且(qie)能夠?動(dong)將(jiang)失敗的(de)(de)任務重新分配（比如一個(ge)計算機出現故障(zhang)了，那有其他副(fu)(fu)本(ben)的(de)(de)計算機會重新進行工作，也就(jiu)是說(shuo)它這個(ge)容(rong)錯性是很(hen)高的(de)(de)。）。

低成本：Hadoop是(shi)開源的(de)，項(xiang)?的(de)軟(ruan)件成本因(yin)?得以??降(jiang)低。

3 Hadoop?態圈

我們再來看一下Hadoop的(de)生(sheng)態(tai)圈，它(ta)的(de)核心組件是(shi)HDFS，還有MapReduce。那隨著處理任務的(de)多樣性，Hadoop生(sheng)態(tai)圈它(ta)的(de)組件會越(yue)來越(yue)多。

3.1 分布式存儲(HDFS)

HDFS就是(shi)將?件切分成(cheng)固定(ding)??的(de)數據(ju)塊block(?件嚴格按(an)照字(zi)節(jie)來切，所以(yi)若是(shi)最(zui)后(hou)切得省?點(dian)點(dian)，也(ye)算單獨(du)?塊，hadoop2.x默(mo)認的(de)固定(ding)??是(shi)128MB，不同(tong)版本,默(mo)認值不同(tong).可以(yi)通過Client端上傳?件設置)。

它(ta)主要是負責(ze)分(fen)布式存(cun)(cun)儲的，它(ta)把一個大(da)文(wen)件切(qie)割(ge)成不同的小塊，然后存(cun)(cun)儲在(zai)相應的節點上，也就是計算機上。默認情況下(xia)呢它(ta)是把這個塊分(fen)成一百二十八兆，當文(wen)件大(da)于(yu)一百二十八兆的時候，它(ta)就會進(jin)行(xing)切(qie)割(ge)。

舉個例子(zi)（如圖(tu)），假(jia)如我現在有一個文件是(shi)二百兆，那(nei)(nei)它(ta)就切(qie)割了兩(liang)(liang)塊(kuai)，分(fen)別放在不(bu)同的(de)節(jie)(jie)點(dian)上(shang)。并且它(ta)對每(mei)一塊(kuai)進行備(bei)份(fen)，默認情況下(xia)是(shi)三個部分(fen)（本(ben)身加兩(liang)(liang)個備(bei)份(fen)）。對于不(bu)同的(de)副本(ben)，它(ta)是(shi)存(cun)儲在不(bu)同的(de)節(jie)(jie)點(dian)上(shang)的(de)，那(nei)(nei)下(xia)一個我們可以這(zhe)樣算，也達到(dao)了這(zhe)樣子(zi)的(de)三塊(kuai)。

也正是(shi)因為HDFS的這(zhe)樣一個(ge)分(fen)布式存儲，還有(you)多副本(ben)的備份(fen)，實現了Hadoop的這(zhe)樣一個(ge)容錯(cuo)性，還有(you)就是(shi)工(gong)作(zuo)量的均衡。

那(nei)如(ru)果我(wo)們(men)把兩(liang)塊(kuai)都(dou)存在了(le)一個節點(dian)上，那(nei)當對(dui)這個數據進(jin)行處(chu)理的時候，我(wo)們(men)可(ke)以第(di)一塊(kuai)的計算那(nei)是在節點(dian)1，那(nei)對(dui)于第(di)二塊(kuai)的計算，我(wo)們(men)就到其他的副本節點(dian)上計算，讓工(gong)作量保持均衡。

所以分布式(shi)存(cun)儲(chu)保證了我們Hadoop系統的這樣(yang)一個高(gao)容特性，還有高(gao)效(xiao)性。

HDFS 的優點：

分布式存儲

?持(chi)分布式和并?計算

?平可伸縮性

3.2 分布式計算(MapReduce)

MapReduce為海(hai)量的(de)數據提供了計算。

MapReduce從它名字(zi)上來看就(jiu)(jiu)?致可以看出個(ge)緣由，兩個(ge)動(dong)詞Map和Reduce，“Map（展開）”就(jiu)(jiu)是(shi)(shi)將(jiang)(jiang)?個(ge)任(ren)(ren)務(wu)分(fen)(fen)(fen)解成為(wei)多個(ge)任(ren)(ren)務(wu)，“Reduce”就(jiu)(jiu)是(shi)(shi)將(jiang)(jiang)分(fen)(fen)(fen)解后多任(ren)(ren)務(wu)處理的(de)結(jie)果(guo)(guo)匯總起來，得(de)出最后的(de)分(fen)(fen)(fen)析結(jie)果(guo)(guo)。MapReduce采?"分(fen)(fen)(fen)?治之"的(de)思想，簡(jian)單地說(shuo)，MapReduce就(jiu)(jiu)是(shi)(shi)"任(ren)(ren)務(wu)的(de)分(fen)(fen)(fen)解與(yu)結(jie)果(guo)(guo)的(de)匯總"。

舉個例(li)子，當有了對(dui)剛才的二百兆這個文件的一個計(ji)(ji)算(suan)的任(ren)務的時候，那MapReduce會(hui)把(ba)我們的這個任(ren)務分發給有這個塊(kuai)的這樣(yang)一個節點，節點進行計(ji)(ji)算(suan)之(zhi)后，然后他再整合輸出。同理，也(ye)是因為MapReduce的分布式計(ji)(ji)算(suan)保證(zheng)了Hadoop的高效(xiao)性。

3.3 HBase

對于數據倉庫(ku)(ku)來(lai)說(shuo)，它存(cun)儲的(de)(de)(de)多數是(shi)(shi)(shi)歷史(shi)數據，不太支持實時的(de)(de)(de)這(zhe)樣(yang)一(yi)個交(jiao)互(hu)。但是(shi)(shi)(shi)HBase它既存(cun)儲數據，也能和HDFS進(jin)行交(jiao)互(hu)，所以(yi)HBase存(cun)儲的(de)(de)(de)數據是(shi)(shi)(shi)可以(yi)支持實時的(de)(de)(de)這(zhe)樣(yang)一(yi)個交(jiao)互(hu)的(de)(de)(de)，也就是(shi)(shi)(shi)說(shuo)它可以(yi)用(yong)來(lai)完(wan)成MySQL、Oracle和SqlServer這(zhe)樣(yang)業務型數據庫(ku)(ku)的(de)(de)(de)功能，但是(shi)(shi)(shi)這(zhe)樣(yang)使用(yong)的(de)(de)(de)還是(shi)(shi)(shi)比較少的(de)(de)(de)。

所以在業(ye)務(wu)系統中，數據(ju)需要實(shi)時交互的，我們還是采用(yong)傳統數據(ju)庫比較好一些(xie)。

3.4 Zookeeper

Zookeeper，主要是(shi)(shi)對于我們的(de)(de)(de)數據(ju)(ju)平臺進行(xing)配置(zhi)和調度的(de)(de)(de)，主要是(shi)(shi)用(yong)來解決(jue)分布式應(ying)用(yong)中經常(chang)遇到的(de)(de)(de)一些(xie)數據(ju)(ju)管理問題，例如(ru)統(tong)一命名(ming)、狀態同步(bu)等(deng)等(deng)。它的(de)(de)(de)目標就是(shi)(shi)封裝好復雜(za)、易出錯的(de)(de)(de)相關服務，將(jiang)簡單、易用(yong)的(de)(de)(de)系(xi)統(tong)提供(gong)給用(yong)戶。

舉個(ge)(ge)例子，假(jia)設我們(men)(men)(men)的程(cheng)序是(shi)(shi)分布式部署(shu)在(zai)(zai)多(duo)臺機(ji)(ji)器上(shang)的，也就(jiu)(jiu)是(shi)(shi)我們(men)(men)(men)每(mei)一(yi)臺機(ji)(ji)器上(shang)都(dou)有相應(ying)的應(ying)用(yong)程(cheng)序。但是(shi)(shi)我們(men)(men)(men)現在(zai)(zai)要更新(xin)，要改(gai)配(pei)(pei)置文件(jian)(jian)，那就(jiu)(jiu)需要逐臺的來進行改(gai)變，這樣就(jiu)(jiu)比較麻煩。但是(shi)(shi)現在(zai)(zai)呢(ni)我們(men)(men)(men)把這個(ge)(ge)配(pei)(pei)置文件(jian)(jian)全部放在(zai)(zai)Zookeeper上(shang)，存儲在(zai)(zai)Zookeeper上(shang)的某個(ge)(ge)目錄中，然后(hou)(hou)相關的應(ying)用(yong)程(cheng)序，也就(jiu)(jiu)是(shi)(shi)在(zai)(zai)每(mei)一(yi)臺機(ji)(ji)器上(shang)的應(ying)用(yong)程(cheng)序就(jiu)(jiu)會監測Zookeeper。當Zookeeper上(shang)的配(pei)(pei)置文件(jian)(jian)發生變化了之后(hou)(hou)，就(jiu)(jiu)會自動的進行下載(zai)、更新(xin)，這樣我們(men)(men)(men)就(jiu)(jiu)避免了每(mei)一(yi)臺機(ji)(ji)器都(dou)進行逐步的更改(gai)。

3.5 Pig Hive ChuKwa

Pig、Hive和ChuKwa屬(shu)于Hadoop生(sheng)態(tai)圈的(de)應用(yong)層(ceng)，主(zhu)要都是(shi)對數(shu)據(ju)進行處理和分析(xi)的(de)，只是(shi)不(bu)同的(de)場景(jing)，選擇不(bu)同的(de)組件會更好一(yi)些(xie)。

后期我會詳細介(jie)(jie)紹(shao)Hive，其他兩部分就(jiu)暫時不(bu)介(jie)(jie)紹(shao)了。

結束語

一直在學習路上！

————————————————

版(ban)權(quan)聲(sheng)明：本文為CSDN博主「報告(gao)，今天也有好好學習」的原創文章，遵(zun)循CC 4.0 BY-SA版(ban)權(quan)協議，轉載(zai)請附(fu)上原文出處鏈接及本聲(sheng)明。

原文鏈(lian)接：//blog.csdn.net/qq_44186838/article/details/119942818

版(ban)權(quan)聲明(ming)：本文內容(rong)系天(tian)翼(yi)云(yun)實名用(yong)戶(hu)自發(fa)貢獻，版(ban)權(quan)歸(gui)原作者所有(you)，天(tian)翼(yi)云(yun)開發(fa)者社區不(bu)(bu)擁(yong)有(you)其著作權(quan)，亦不(bu)(bu)承(cheng)擔相應法律責任，原文鏈接：//blog.csdn.net/qq_44186838/article/details/119942818

作者：報告，今天也有(you)好(hao)好(hao)學(xue)習(xi)，如需轉載，請聯系作者。

原文(wen)(wen)出處及轉(zhuan)載(zai)信息見文(wen)(wen)內(nei)詳細(xi)說(shuo)明，如有疑問或爭議，請聯系ctyunbbs@chinatelecom.cn刪(shan)除。

文章來自個人專欄

文章 | 訂閱

0條評論

0 / 1000

請輸入你的評論

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】

亚欧色一区w666天堂,色情一区二区三区免费看,少妇特黄A片一区二区三区,亚洲人成网站999久久久综合,国产av熟女一区二区三区

活動

應用商城

定價

合作伙伴

開發者

支持與服務

了解天翼云

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】

一文搞懂什么是Hadoop？Hadoop的優點有哪些？Hadoop?態圈【詳細介紹】