
通過squid做代理訪問網頁 首先安裝squid參考:http://www.lxweimin.com/p/24b40b657d22[https:...
之前在windows上配置全局上網方式用的是cisco的anyconnect,在Ubuntu下面也安裝了cisco的anyconnect:htt...
詞向量也稱為詞嵌入,是指將詞轉換成為向量的形式。 為何需要詞向量 對于非結構化的數據:音頻,圖片,文字。前面兩種的數據存儲方式是天然高維和高密度...
Spark提供了三種主要的與數據相關的API: RDD DataFrame DataSet 下面詳細介紹下各自的特點: RDD 主要描述:RDD...
Spark的MLlib專門設計了一些工具用來對ML算法和Pipeline進行調優。比如內置的交叉驗證和其他工具能夠方便用戶對算法和Pipelin...
Spark的MLlib實現了協同過濾(Collaborative Filtering)這個功能。官網文檔鏈接 熟悉推薦算法的同學可能也有這個認識...
整理歸納在Python中使用對數據處理的常用方法,包括與HDFS文件的讀寫,主要是怕用的時候記不住,容易搞混,再搜也不爽,好記性不如爛筆頭,寫下...
最近因為工作需要,要研究下TensorFlow,所以總結下我這兩天在Windows平臺上安裝的經歷?;蛟S有人能用到。首先說下,我安裝的時候Ten...
介紹 本篇文章主要摘自Spark官網的Spark Programming Guide,在之前的一篇文章中已經有對這里面一些概念的基本介紹,這里就...