百度天算大數據平臺初體驗

曾經試用過主流大廠提供的大數據平臺服務，僅從用戶體驗角度上來說，各有千秋。

百度天算控制臺功能分類明確，使用簡單，組件版本較新，客服響應及時

百度天算控制臺

騰訊大數據處理套件TBDS 沒有完全開放服務，使用前需要申請，申請周期較長。我通過聯系客服，獲得了一個臨時體驗賬號，見第二張圖

騰訊大數據處理套件TBDS

通過客服提供的臨時賬號登陸TBDS

華為企業云控制臺提供開發、測試管理流程（果然是以軟件著稱），Spark版本較低（1.5.1），退還押金讓人蛋疼（走各類審批流程、客服多次騷擾、周期長）

華為企業云控制臺

阿里云數加控制臺阿里的云平臺種類較多，云梯（貌似已下線）、飛天（自研）、數加，有點眼花繚亂。因為是自研，使用較繁雜（可能是因為不熟悉），使用前要購買MaxCompute服務，性能較好（個人體驗）

阿里云數加控制臺

Amazon EMR控制臺各組件基本是當前最新版本！申請賬號時需要綁定信用卡，萬一集群忘記銷毀。。。

Amazon EMR控制臺

各產品的收費情況和其能提供的服務器性能、服務功能相關，收費方式多樣化，可年、月、時。4臺規模集群的Hadoop+Spark服務，大概3-5元／小時不等。

因為都是大廠的大數據平臺產品，所以肯定都是功底深厚、面向廣泛。上述描述，僅僅是個人體驗，不具有通用性、不帶有批判性、沒有代表性。

本文僅簡單介紹一下我比較喜歡的百度天算這個產品：
使用過程如下：執行WordCount應用程序，統計文本中單詞詞頻。

需要使用對象存儲BOS和百度MapReduce BMR功能

使用對象存儲BOS和百度MapReduce BMR功能
進入對象存儲BOS后，用戶通過新建bucket，建立存放在 BOS上的文件夾

新建Bucket
將需要執行的Spark應用程序及被測數據上傳到剛才建立的文件夾中

上傳文件
通過導航欄進入百度MapReduce功能，準備創建集群

創建集群
配置集群名稱、登錄用戶名、密碼（用來進入Web UI和SSH連接）、BOS路徑、選擇組件版本

集群配置頁面
我選擇使用Hadoop 2.7、Spark 1.6.0、Hue 3.10.0、HBase 1.1.2，創建4個節點

集群配置頁面

付費

付費
支付成功后，集群就開通了

集群成功開通
4臺規模的集群，初始化了10分鐘，時間較長，應該是啟動虛機后，根據用戶的選擇，下載相應的組件包，修改配置，啟動服務。

集群正在初始化
集群服務啟動成功

集群服務啟動成功
通過集群的實例詳情，可以鏈接Yarn Web UI和Hue Web UI

集群詳情頁面
通過導航欄選擇作業，創建作業

創建作業
選擇Spark作業，指定Spark-submit命令參數及應用程序參數（位置在BOS）

配置作業參數

作業創建成功后，等待執行

作業等待執行
作業執行過程中可以查看作業詳情

作業執行過程中可以查看作業詳情
一段時間后，作業完成

作業成功的執行完畢
通過查看作業日志，觀察輸出結果

通過查看作業日志，觀察輸出結果
通過集群界面中的Hadoop Yarn Web UI鏈接，查看應用程序的具體執行情況

選擇Hadoop Yarn Web UI鏈接

Hadoop Yarn Web UI界面

可用在集群的監控頁面，觀察集群狀態和各大數據組件信息

集群的監控頁面

集群的監控頁面
可以在導航欄選擇多用戶訪問控制，對多用戶權限進行管理和控制

多用戶訪問控制頁面

多用戶訪問控制頁面
百度云提供詳盡的產品手冊，對用戶進行指導

百度云產品手冊

使用過程中一些小坑：

集群環境默認使用JDK 1.7版本，所以用戶編譯應用程序時，請使用JDK 1.7，否則會出現類似:Unsupported major.minor.version 51.0的錯誤
集群環境默認使用Scala 2.10版本，所以用戶編譯應用程序時，請使用Scala 2.10.x，否則會出現類似： java.lang.AbstractMethodError: bdsparkwc$1.call(Ljava/lang/Object;)Ljava/lang/Iterable;的錯誤
當應用程序執行完畢后，無法使用Yarn Web UI來登陸應用程序的Driver Web UI 4040界面，估計是Spark History Server服務沒有開啟
其提供IP用來SSH連接，經常出現超時

總結：
目前來看，主流大廠都是通過這種SaaS方式來提供大數據平臺全托管的服務，面向一些沒有數據中心、沒有運維能力的中小型企業，按需部署和使用，非常的快捷。通過其詳盡的產品使用指南，用戶再具備一些大數據組件相關使用的知識，就可以快速的進行大數據的清洗、挖掘、分析和報告，無需為集群節點分配、部署、優化、維護投入時間。

相關鏈接：

WordCount應用程序源碼
百度MapReduce BMR指南

最后編輯于：2017.12.07 07:37:34

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,797評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,179評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,628評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,642評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,444評論 6贊 405
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,948評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,040評論 3贊 440
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,185評論 0贊 287
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,717評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,602評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,794評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,316評論 5贊 358
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,045評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,418評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,671評論 1贊 281
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,414評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,750評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

百度天算大數據平臺初體驗

百度天算大數據平臺初體驗

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

百度天算大數據平臺初體驗

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频