本內容為【科研私家菜】R語言機器學習與臨床預測模型系列課程
R小鹽準備介紹R語言機器學習與預測模型的學習筆記
你想要的R語言學習資料都在這里, 快來收藏關注【科研私家菜】
01 神經網絡
人工神經網絡(Artificial Neural Network)簡單而言是一種分類算法,是機器學習和認知科學領域中一種模仿生物神經網絡的結構和功能的數學模型或計算模型,用于對函數進行估計或近似。。作為機器學習的一個龐大分支,人工神經網絡目前大約有幾百種算法,其中包括一些著名的ANN算法:感知器神經網絡(Perceptron Neural Network), 反向傳遞(Back Propagation), Hopfield網絡和自組織映射(Self-Organizing Map, SOM)等等。
分類器的輸入是一個數值向量,叫做屬性或者特征。分類器的目的就是要使正確分類的可能性盡可能的高,錯分的概率盡可能的低,一般我們會人為的劃分一些樣本做好標記作為訓練樣本,訓練好的樣本拿來對測試樣本進行檢驗,這就是一個分類算法的基本原理。人工神經網絡是一種監督分類算法。
神經網絡由三部分組成,分別是最左邊的輸入層,隱藏層(實際應用中遠遠不止一層)和最右邊的輸出層。層與層之間用線連接在一起,每條連接線都有一個對應的權重值 w,除了輸入層,一般來說每個神經元還有對應的偏置
02 神經網絡R語言實現
R語言有多個關于神經網絡的包,包括nnet、AMORE、neuralnet和RSSNS包,nnet提供了最常見的前饋反向傳播神經網絡算法。AMORE包則更進一步提供了更為豐富的控制參數,并可以增加多個隱藏層。neuralnet包的改進在于提供了彈性反向傳播算法和更多的激活函數形式,而RSNNS包則擴充了其它拓撲結構和網絡模型。
library(caret)
library(MASS)
library(neuralnet)
library(vcd)
data(shuttle)
str(shuttle)
table(shuttle$use)
table1 <- structable(wind + magn ~ use, shuttle)
table1
mosaic(table1, shade = T)
mosaic(use ~ error + vis, shuttle)
table(shuttle$use, shuttle$stability)
prop.table(table(shuttle$use, shuttle$stability))
chisq.test(shuttle$use, shuttle$stability)
dummies <- dummyVars(use ~. ,shuttle, fullRank = T)
dummies
shuttle.2 <- data.frame(predict(dummies, newdata = shuttle))
names(shuttle.2)
head(shuttle.2)
shuttle.2$use <- ifelse(shuttle$use == "auto", 1, 0)
table(shuttle.2$use)
set.seed(123)
trainIndex <- createDataPartition(shuttle.2$use, p = .7,
list = F)
# head(trainIndex)
shuttleTrain <- shuttle.2[ trainIndex, ]
shuttleTest <- shuttle.2[-trainIndex, ]
#### 模型構建與評價 -------
n <- names(shuttleTrain)
form <- as.formula(paste("use ~", paste(n[!n %in% "use"], collapse = " + ")))
form
set.seed(1)
fit <- neuralnet(form, data = shuttleTrain, hidden = c(2, 1), err.fct = "ce",
linear.output = F)
fit$result.matrix
head(fit$generalized.weights[[1]])
plot(fit)
par(mfrow=c(1,2))
gwplot(fit, selected.covariate = "vis.yes")
gwplot(fit, selected.covariate = "wind.tail")
resultsTrain <- compute(fit, shuttleTrain[, 1:10])
predTrain <- resultsTrain$net.result
predTrain <- ifelse(predTrain >= 0.5, 1, 0)
table(predTrain, shuttleTrain$use)
resultsTest <- compute(fit, shuttleTest[,1:10])
predTest <- resultsTest$net.result
predTest <- ifelse(predTest >= 0.5, 1, 0)
table(predTest, shuttleTest$use)
which(predTest == 1 & shuttleTest$use == 0)
效果如下:
關注R小鹽,關注科研私家菜(VX_GZH: SciPrivate),有問題請聯系R小鹽。讓我們一起來學習 R語言機器學習與臨床預測模型