有關Linear regression的背景知識
Linear regression 線性回歸,我們先來看官方的解釋:
線性回歸(Linear regression)是一種以線性模型來建模自變量與因變量關系的方法. 通常來說, 當自變量只有一個的情況被稱為簡單線性回歸, 自變量大于一個的情況被稱為多重線性回歸。
其實這個東西我們在上初中的時候就接觸過,就是一元一次方程啊。
Y = a X + b
所謂的簡單線性回歸也不過是一元一次方程,多重線性回歸就是多元一次方程了
Y = a X + b Z + c
而所謂編程實現的線性回歸的過程,就是尋找最優解a,b,c的過程。
然而,科學嚴肅的解釋是這樣的:
在線性回歸模型中, 模型的未知參數由數據中估計得到. 最常用的擬合方法是最小二乘法, 但是也有許多其他的擬合方法. 因此需要甄別的是, 使用最小二乘法求解并不是構成線性回歸模型的必要條件.
線性回歸是應用最廣泛的回歸分析之一, 主要可以用于以下兩類:
- 預測: 線性回歸可以在擬合到已知數據集后用于預測自變量所對應的因變量。
- 解釋: 線性回歸可以用于量化因變量與自變量之間關系的強度。
利用tensorflow中的API實現線性回歸
1.定義參數
learning_rate = 0.01 # 學習率
training_epochs = 1000 #學習次數
display_step = 50 #隔50次檢查一次精確度
2.給出訓練數據
# Training Data
train_X = numpy.asarray([3.3,4.4,5.5,6.71,6.93,4.168,9.779,6.182,7.59,2.167,
7.042,10.791,5.313,7.997,5.654,9.27,3.1])
train_Y = numpy.asarray([1.7,2.76,2.09,3.19,1.694,1.573,3.366,2.596,2.53,1.221,
2.827,3.465,1.65,2.904,2.42,2.94,1.3])
n_samples = train_X.shape[0]
其中,shape()函數的作用是求已知數組的維度,如果是一維數組,給出的是一個具體的數,如果是多維的,就是一個list.返回的總是一個列表,一位數組返回的是只有一個值的列表
3.初始化圖像,并命名
# tf Graph Input //線性模型參數初始化
X = tf.placeholder("float")
Y = tf.placeholder("float")
# Set model weights
W = tf.Variable(rng.randn(), name="weight")
b = tf.Variable(rng.randn(), name="bias")
其實就是將我們要在后面需要擬合的變量W和b命名和初始化。
4.定義一元一次方程的實現邏輯 ,也就是定義線性模型
# Construct a linear model
pred = tf.add(tf.multiply(X, W), b)
類似于 : Y = a X + b
5.定義代價函數,對于代價函數的理解,就是實際擬合的數值和實際值之間的誤差的加和。代價可以看做預測值與真實值之間的距離。
# Mean squared error 定義均方差代價函數
cost = tf.reduce_sum(tf.pow(pred-Y, 2))/(2*n_samples)
6.定義優化器,將學習率帶入其中,并且告訴學習的目的是最小化cost值,并定義初始化函數。
#優化器 ,使用隨機梯度下降法進行優化
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)
# Initialize the variables (i.e. assign their default value)
#定義初始化
init = tf.global_variables_initializer()
7.開始訓練:
# Start training
with tf.Session() as sess:
# Run the initializer
sess.run(init)
# Fit all training data
for epoch in range(training_epochs):
for (x, y) in zip(train_X, train_Y):
sess.run(optimizer, feed_dict={X: x, Y: y})
# Display logs per epoch step
if (epoch+1) % display_step == 0:
c = sess.run(cost, feed_dict={X: train_X, Y:train_Y})
print("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(c), \
"W=", sess.run(W), "b=", sess.run(b))
print("Optimization Finished!")
training_cost = sess.run(cost, feed_dict={X: train_X, Y: train_Y})
print("Training cost=", training_cost, "W=", sess.run(W), "b=", sess.run(b), '\n')
# Graphic display
plt.plot(train_X, train_Y, 'ro', label='Original data')
plt.plot(train_X, sess.run(W) * train_X + sess.run(b), label='Fitted line')
plt.legend()
plt.show()
對應輸出的內容是:
Epoch: 0050 cost= 0.195095107 W= 0.441748 b= -0.580876
Epoch: 0100 cost= 0.181448311 W= 0.430319 b= -0.498661
Epoch: 0150 cost= 0.169377610 W= 0.419571 b= -0.421336
Epoch: 0200 cost= 0.158700854 W= 0.409461 b= -0.348611
Epoch: 0250 cost= 0.149257123 W= 0.399953 b= -0.28021
Epoch: 0300 cost= 0.140904188 W= 0.391011 b= -0.215878
Epoch: 0350 cost= 0.133515999 W= 0.3826 b= -0.155372
Epoch: 0400 cost= 0.126981199 W= 0.374689 b= -0.0984639
Epoch: 0450 cost= 0.121201262 W= 0.367249 b= -0.0449408
Epoch: 0500 cost= 0.116088994 W= 0.360252 b= 0.00539905
Epoch: 0550 cost= 0.111567356 W= 0.35367 b= 0.052745
Epoch: 0600 cost= 0.107568085 W= 0.34748 b= 0.0972751
Epoch: 0650 cost= 0.104030922 W= 0.341659 b= 0.139157
Epoch: 0700 cost= 0.100902475 W= 0.336183 b= 0.178547
Epoch: 0750 cost= 0.098135538 W= 0.331033 b= 0.215595
Epoch: 0800 cost= 0.095688373 W= 0.32619 b= 0.25044
Epoch: 0850 cost= 0.093524046 W= 0.321634 b= 0.283212
Epoch: 0900 cost= 0.091609895 W= 0.317349 b= 0.314035
Epoch: 0950 cost= 0.089917004 W= 0.31332 b= 0.343025
Epoch: 1000 cost= 0.088419855 W= 0.30953 b= 0.370291
Optimization Finished!
Training cost= 0.0884199 W= 0.30953 b= 0.370291
當tensorflow里面的session調用run()方法的時候,才是真正初始化的時候。
上訴代碼的邏輯是:初始化-->遍歷數據集-->每隔一個step輸出一次-->描點劃線
8.測試機開始測試:
# Testing example, as requested (Issue #2)
test_X = numpy.asarray([6.83, 4.668, 8.9, 7.91, 5.7, 8.7, 3.1, 2.1])
test_Y = numpy.asarray([1.84, 2.273, 3.2, 2.831, 2.92, 3.24, 1.35, 1.03])
print("Testing... (Mean square loss Comparison)")
testing_cost = sess.run(
tf.reduce_sum(tf.pow(pred - Y, 2)) / (2 * test_X.shape[0]),
feed_dict={X: test_X, Y: test_Y}) # same function as cost above
print("Testing cost=", testing_cost)
print("Absolute mean square loss difference:", abs(
training_cost - testing_cost))
plt.plot(test_X, test_Y, 'bo', label='Testing data')
plt.plot(train_X, sess.run(W) * train_X + sess.run(b), label='Fitted line')
plt.legend()
plt.show()
對應輸出的內容是:
上訴就是一個典型的線性回歸實現的過程。
同系列總結:
tensorflow學習筆記(1)|win10系統pip安裝tensorflow
tensorflow學習筆記(2)|基本函數入門