Hadoop教程:特性,組件,集群和拓?fù)?/h1>

翻譯自:http://www.guru99.com/learn-hadoop-in-10-minutes.html

Apache HADOOP是用于開發(fā)在分布式計(jì)算環(huán)境中執(zhí)行的數(shù)據(jù)處理應(yīng)用程序的框架。

類似于存儲在個人計(jì)算機(jī)系統(tǒng)的本地文件系統(tǒng)中的數(shù)據(jù),在Hadoop中,數(shù)據(jù)存儲在被稱為 Hadoop分布式文件系統(tǒng)的分布式文件系統(tǒng)中。

處理模型基于“數(shù)據(jù)局部性”概念,其中計(jì)算邏輯被發(fā)送到包含數(shù)據(jù)的集群節(jié)點(diǎn)(服務(wù)器)。

這種計(jì)算邏輯只不過是用高級語言(如Java)編寫的程序的編譯版本。這樣的程序,處理存儲在Hadoop HDFS中的數(shù)據(jù)。

HADOOP是一個開源軟件框架。使用HADOOP構(gòu)建的應(yīng)用程序在分布在普通計(jì)算機(jī)集群上的大型數(shù)據(jù)集上運(yùn)行。

普通電腦價(jià)格便宜,廣泛應(yīng)用。這些主要用于以低成本實(shí)現(xiàn)更大的計(jì)算能力。

你知道嗎?計(jì)算機(jī)集群由一組多個處理單元(存儲磁盤+處理器)組成,它們彼此連接并作為單個系統(tǒng)。

Hadoop的組件

下圖顯示了Hadoop生態(tài)系統(tǒng)中的各種組件 -

061114_0803_LearnHadoop4.png

Apache Hadoop包含兩個子項(xiàng)目

  1. Hadoop MapReduce MapReduce是一個用于編寫在Hadoop上運(yùn)行的應(yīng)用程序的計(jì)算模型和軟件框架。這些MapReduce程序能夠在大型計(jì)算節(jié)點(diǎn)集群上并行處理大量數(shù)據(jù)。
  2. HDFS(Hadoop分布式文件系統(tǒng)) HDFS負(fù)責(zé)Hadoop應(yīng)用程序的存儲部分。MapReduce應(yīng)用程序使用HDFS中的數(shù)據(jù)。HDFS創(chuàng)建多個數(shù)據(jù)塊副本,并將它們分布在集群中的計(jì)算節(jié)點(diǎn)上。這種分布使得可靠和極快速的計(jì)算成為可能。

盡管Hadoop最為人所知的是MapReduce及其分布式文件系統(tǒng)-HDFS,但該術(shù)語也用于一系列屬于分布式計(jì)算和大規(guī)模數(shù)據(jù)處理的相關(guān)項(xiàng)目。在其他的Hadoop相關(guān)項(xiàng)目的Apache包括有Hive,HBase,Mahout,Sqoop,F(xiàn)lume和Zookeeper。

'Hadoop'

  • 適用于大數(shù)據(jù)分析

由于大數(shù)據(jù)在本質(zhì)上往往是分布式和非結(jié)構(gòu)化的,HADOOP集群最適合分析大數(shù)據(jù)。由于流向計(jì)算節(jié)點(diǎn)的是處理邏輯(不是實(shí)際數(shù)據(jù)),所以消耗更少的網(wǎng)絡(luò)帶寬。這個概念被稱為數(shù)據(jù)局部性,有助于提高基于Hadoop的應(yīng)用程序的效率。

  • 可擴(kuò)展性

HADOOP集群可以通過添加額外的集群節(jié)點(diǎn)輕松擴(kuò)展到任何程度,從而允許大數(shù)據(jù)的增長。此外,規(guī)模不需要修改應(yīng)用程序邏輯。

  • 容錯

HADOOP生態(tài)系統(tǒng)具有將輸入數(shù)據(jù)復(fù)制到其他集群節(jié)點(diǎn)的功能。這樣,在群集節(jié)點(diǎn)故障的情況下,數(shù)據(jù)處理仍然可以通過使用存儲在另一群集節(jié)點(diǎn)上的數(shù)據(jù)來進(jìn)行。

Hadoop中的網(wǎng)絡(luò)拓?fù)?/h3>

當(dāng)hadoop集群的大小增長時,網(wǎng)絡(luò)的拓?fù)洌ú贾茫绊慔adoop集群的性能。除了性能之外,還需要關(guān)注高可用性和故障處理。為了實(shí)現(xiàn)這種Hadoop集群的形成,利用網(wǎng)絡(luò)拓?fù)洹?/p>

通常,網(wǎng)絡(luò)帶寬是在構(gòu)成任何網(wǎng)絡(luò)時要考慮的重要因素。然而,由于測量帶寬可能很困難,在Hadoop中,網(wǎng)絡(luò)被表示為樹,并且該樹的節(jié)點(diǎn)之間的距離(跳數(shù))被認(rèn)為是形成Hadoop集群的重要因素。這里,兩個節(jié)點(diǎn)之間的距離等于它們到它們最接近的共同祖先的距離的總和。

Hadoop集群由數(shù)據(jù)中心,機(jī)架和實(shí)際執(zhí)行作業(yè)的節(jié)點(diǎn)組成。這里,數(shù)據(jù)中心由機(jī)架和機(jī)架組成的節(jié)點(diǎn)組成。可用于進(jìn)程的網(wǎng)絡(luò)帶寬取決于進(jìn)程的位置。也就是說,下面情況可用帶寬依次變得更小:

  • 進(jìn)程在同一個節(jié)點(diǎn)上
  • 同一機(jī)架上的不同節(jié)點(diǎn)
  • 同一數(shù)據(jù)中心不同機(jī)架上的節(jié)點(diǎn)
  • 不同數(shù)據(jù)中心的節(jié)點(diǎn)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,428評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,024評論 3 413
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,285評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,548評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,328評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,878評論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,971評論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,098評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,616評論 1 331
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,554評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,725評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,243評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 43,971評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,361評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,613評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,339評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,695評論 2 370

推薦閱讀更多精彩內(nèi)容