
IP屬地:北京
最近看了下structured streaming 的基本用法,大部分雖然是翻譯官方文檔,但是從翻譯中也可以加深理解。 基本介紹和編程模型 Sp...
Spark Core & SparkSQL dataframe與dataset統(tǒng)一,dataframe只是dataset[Row]的類型別名,移...
我們從這個入口開始分析,task對rdd開始處理。 SparkEnv.get.cacheManager.getOrCompute 方法追蹤 Bl...
在分析Stage劃分算法之前,需要知道RDD的寬依賴和窄依賴的概念。窄依賴:Narrow Dependency,即每個RDD的partition...
RDD的持久化也就是說假如我們從hdfs讀取文件,形成RDD。當我們對RDD進行持久化操作之后,,然后再針對該RDD進行action操作(這里我...
最近想看下hadoop job提交的源碼,結果在mac使用偽分模式提交job時,導致job提交失敗。主要遇到的問題有兩個: 1、通過訪問jo...
1.首先在MySQL 官方網站下載http://dev.mysql.com/downloads/file/?id=466265 按照步驟直接安裝...
筆者介紹的是在MAC環(huán)境下使用Idea搭建spark環(huán)境。 環(huán)境: spark 2.0.0 scala 2.11.8 maven 3.9.9 i...