第一課 Hadoop生態圈 與Zookeeper應用實踐筆記

一、大數據技術體系


大數據應用領域

互聯網領域:搜索引擎、推薦系統、廣告系統

電商領域:用戶畫像、推薦系統、用戶行為分析

醫療領域:流行病預測、病情分析

視頻領域:用戶標簽系統、視頻分析、廣告系統

金融領域:風控系統、欺詐分析

二、如何學習大數據(老師建議)

1.良好的自主學習能力和動手能力

2.系統了解大數據生態系統技術框架

3.找到學習切入點,不斷拓展知識的廣度(大數據平臺開發、數據分析)

4.抓住一個技術方向,不斷深入研究,增加知識結構的深度

5.主動學習探索新知識

6.定期知識梳理

三、大數據必備技能(重點)


四、大數據就業方向

1、大數據分析工程師

2、大數據平臺開發工程師

3、大數據運維工程師

4、大數據算法工程師

5、大數據內核開發工程師


五、Zookeeper設計原理

1、分布式系統概念:是一個硬件或軟件組件分布在不同的網絡計算機上,彼此之間通過消息傳遞進行通信和協調的系統?!斗植际较到y概念與設計》

2、分布式特點:分布性、對等性、并發性、缺乏全局時鐘、故障總是會發生

3、為什么選擇Zookeeper? 開源免費、高效、可靠的解決數據一致性問題、簡單易用、工業界大型分布式系統廣泛應用。

4、Zookeeper 概念:一個開源的針對大型分布式系統的可靠協調系統。

提供的功能包括:發布/訂閱,分布式協調/通知,配置管理,集群管理,主從協調,分布式鎖等。

5、Zookeeper特性:最終一致性、順序性、可靠性、實時性、原子性、單一視圖


6.Zookeeper的架構


重點(zookeeper架構)

注意:如果leader掛掉了會從follwer里面選取,不會從觀察者(Observer)中選取


zookeeper角色

7.Zookeeper寫入

(1)數據寫入最終一致性核心算法:ZAB算法

(2)Leader負責處理寫事務請求(收到半數以上的Follwer的請求,提交給Follwer,Leader會自身也提交請求)


寫入的過程

8.Zookeeper選舉

服務器四種狀態:looking/leading/follwing/observer






znode數據模型


9.Znode節點類型:不允許在臨時節點下創建

Znode版本號,初始為0每次操作一次+1.


悲觀鎖一般解決并發問題,要求對數據從頭到尾都加鎖。排他性

樂觀鎖一般用于并發不大,數據沖突不強烈的。事務請求,同時并發會回滾操作。



重要的機制


六、重要概念解答(老師解答)

1、心跳的意思是,從節點周期性的向leader發送消息,比如2秒鐘發送一次消息,這種有規律的通信就叫做心跳

2、znode是zookeeper中的一個數據節點,znode下還可以創建子znode,可以理解為文件夾的構造,一個文件夾下可以有子文件夾或者子文件

3、整個集群會選舉出一個leader,這個leader負責處理客戶端的事務請求,事務請求包括znode的創建、修改、刪除等,follower負責處理客戶端的讀請求。

4、維護Znode:當集群中的任何一個follower節點接收到客戶端的事務請求,都會轉發給leader,也就是說整個集群只有leader可以處理事務請求,其他角色的節點都不能處理,當leader處理事務請求的時候,就要向整個集群廣播一個提議,這個提議的意思就是告訴follower你們要創建/修改/刪除一個znode,然后follower接收到leader的提議之后,就會做相應的操作,操作完成告訴leader完成了。

當leader接收到集群中的大多數follower的成功操作的回復之后,這里的大多數指的是超過集群機器數量的一半。

當收到大多數follower的回復之后,leader就認為這次事務被成功處理了,然后再向集群通知所有的follower提交事務,最后會返回給客戶端一個事務被成功處理的狀態。

如果有落后的follower,這些落后的follower也會從leader同步狀態,保持與leader的狀態一致。

七、Zookeeper安裝配置常見問題及解決方法



問題一如下圖:


通過ssh-copy-id命令將node01這臺機器root用戶的公鑰文件(id_rsa.pub)文件內容拷貝到node02和node03兩臺機器時報錯

問題分析:路徑錯誤

scp?-r?/home/hadoop/apps/zookeeper-3.4.10?hadoop@node02:/home/hadoop/apps

問題解決:按照最新安裝文檔14步驟操作

問題二如下圖:


解決辦法:要在所有機器的/etc/hosts中配置ip和主機名稱的映射關系:如下


問題三如下圖:


問題分析:配置的root用戶的免密碼登錄,然后使用的hadoop的用戶拷貝,導致提示輸入免密

解決方法:如果用hadoop用戶拷貝,要配置hadoop用戶的ssh免密碼登錄。配置root免密登錄不代表所有用戶都可以免密碼登錄。

問題四如下圖:


問題分析:配置好后使用root用戶啟動成功了zookeeper,導致hadoop用戶無權限啟動。

解決辦法:用root用戶直接去data目錄下刪除掉那個pid文件用hadoop用戶啟動就好了。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,030評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,310評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,951評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,796評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,566評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,055評論 1 322
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,142評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,303評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,799評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,683評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,899評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,409評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,135評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,520評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,757評論 1 282
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,528評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,844評論 2 372

推薦閱讀更多精彩內容