環(huán)境安裝
mac中安裝python的庫(kù)numpy,scipy,pandas,matplotlib,sklearn都可以使用pip安裝
例如$pip install sklearn
- nltk:自然語言處理
pip install -U nltk - igraph:社交網(wǎng)絡(luò)數(shù)據(jù)分析
pip install -U python-igraph - scikit-learn:機(jī)器學(xué)習(xí)模塊
pip install -U scikit-learn
Anaconda是一個(gè)云端的python環(huán)境,交互式編譯python代碼
sklearn邏輯斯特回歸簡(jiǎn)單例子
from numpy import *
from sklearn.datasets import load_iris # import datasets
# load the dataset: iris
iris = load_iris()
samples = iris.data
#print samples
target = iris.target
# import the LogisticRegression
from sklearn.linear_model import LogisticRegression
classifier = LogisticRegression() # 使用類,參數(shù)全是默認(rèn)的
classifier.fit(samples, target) # 訓(xùn)練數(shù)據(jù)來學(xué)習(xí),不需要返回值
x = classifier.predict([5, 3, 5, 2.5]) # 測(cè)試數(shù)據(jù),分類返回標(biāo)記
print x
#其實(shí)導(dǎo)入的是sklearn.linear_model的一個(gè)類:LogisticRegression, 它里面有許多方法
#常用的方法是fit(訓(xùn)練分類模型)、predict(預(yù)測(cè)測(cè)試樣本的標(biāo)記)
#不過里面沒有返回LR模型中學(xué)習(xí)到的權(quán)重向量w,感覺這是一個(gè)缺陷