在配置好tensorflow環境之后,終于要開始第一個tensorflow項目了,在這里,我展示一個簡單的神經網絡來對一個滿足一元二次函數的原始數據進行擬合。
這個代碼是參考書籍tensorflow技術解析與實踐
在此基礎上,我做了比較全面的解釋
下面是代碼
import tensorflow as tf
import numpy as np
#在-1到1區間等差產生300個數據點,然后轉換為1行300列的矩陣形式#
x_data = np.linspace(-1, 1, 300)[:, np.newaxis]
#產生一些噪點然后形式和x_data一樣,數據的均值為0,方差為0.05
noise = np.random.normal(0, 0.05, x_data.shape)
#創建y_data,形式為x^2+1+noise,添加噪點使得數據更加的離散
y_data = np.square(x_data) + 1 + noise
#創建xs,ys,在這里要使用tf.placeholder()先把位置占上,因為tensorflow是符號式計算,要先把網絡建立好,然后在計算時再填充數據
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
#在這個例子中,我打算創建一個兩層的神經網絡,包括一個隱藏層和一個輸出層
#現在定義一個add_layer
def add_layer (inputs, in_size, out_size, activation_function=None):
#定義神經層中的參數為weights和biases,這里定義它們的類型為tf.Variable,它們在計算圖中有固定的位置,不會像張量那樣可以流動,
#其中權重weights的矩陣形式為 行:in_size ,列:out_size
#其中偏置biases的矩陣形式為 行:1 ,列:out_size,
#類似于y = a * x + b ,這里的兩個參數就是a和b,
weights = tf.Variable(tf.random_normal([in_size, out_size]))
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
#定義Wx_plus_h,它是將輸入與權重矩陣相乘,然后加上偏置,如果激活函數為空,就讓輸出等于Wx_plus_h,如果激活函數不為空,就將輸出等于激活函數作用于Wx_plus_h的值,
Wx_plus_b = tf.matmul(inputs, weights) + biases
if activation_function is None:
outputs = Wx_plus_b
else:
outputs = activation_function(Wx_plus_b)
return outputs
#定義第一個隱藏層,利用之前定義好的add_layer函數,輸入的值為xs,因為輸入有一個值,所以in_size=1,在這里定義隱藏層有20個神經元,所以out_size=20,激活函數為tf.nn.relu
h1 = add_layer(xs, 1, 20, activation_function=tf.nn.relu)
#定義第二個隱藏層,也就是輸出層。因為接受上一層的輸出,所以這一層的輸入in_size=20 ,輸出仍然為1
prediction = add_layer(h1, 20, 1, activation_function=None)
#定義偏差,這里的偏差為輸出值與真實值ys的偏差
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction), reduction_indices=[1]))
#然后使用優化器進行優化,設置優化方法為gradientdescent學習率learning rate為0.1
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
#這一步非常的重要,在定義了Variable變量之后,一定要有一個初始化的過程
init = tf.global_variables_initializer()
#在tensorflow中,前面的動作是創建一個計算流程圖,然后,在session.run 之后,數據才會被填充到圖中,然后“流動”,就像它的名字一樣,tensor flow,所以下面的步驟是絕對不能少的
with tf.Session() as sess:
sess.run(init)
for i in range(1000):
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 100 == 0:
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
最后是運行的結果,可以看出在進行100次后,誤差就已經很小了