
1、淺談數據挖掘中的關聯規則挖掘 2、Hadoop/MapReduce購物籃分析:關聯規則挖掘 3、Spark購物籃分析 過程分析:
一 馬爾科夫模型 ? 每個狀態只依賴之前有限個狀態– N階馬爾科夫:依賴之前n個狀態– 1階馬爾科夫(即《中文分詞基礎》中的二元模型):僅僅依賴...
準備數據 建表: 導入數據: 實驗: inner join left join right join full outer join left ...
查詢全體學生的學號與姓名 查詢選修了課程的學生姓名 ----hive的group by 和集合函數 查詢學生的總人數 計算1號課程的學生平均成績...
測試數據 創建分桶表 設置變量,設置分桶為true, 設置reduce數量是分桶的數量個數 加載數據 檢查剛剛加載的數據 創建測試數據表 //結...
創建表 查看剛剛創建的表 造測試數據 加載測試數據 由于是內部表上圖紅色路徑中的元數據在drop表的同時也會被清除 第一步,先求個用戶的月總金額...
參考文章:https://blog.csdn.net/ForgetThatNight/article/details/80009698https...
YARN:資源(linux資源隔離機制:運算資源---運算程序jar/配置文件/CPU/內存/IO--從linux中開辟出諸如內存、處理器的co...
1、mapTask調用InputFormat再調用RecourReader的read()方法來讀取數據,獲得key、value,mapreduc...