學習筆記TF036:實現Bidirectional LSTM Classifier

雙向循環神經網絡(Bidirectional Recurrent Neural Networks,Bi-RNN)，Schuster、Paliwal，1997年首次提出，和LSTM同年。Bi-RNN，增加RNN可利用信息。普通MLP，數據長度有限制。RNN，可以處理不固定長度時序數據，無法利用歷史輸入未來信息。Bi-RNN，同時使用時序數據輸入歷史及未來數據，時序相反兩個循環神經網絡連接同一輸出，輸出層可以同時獲取歷史未來信息。

Language Modeling，不適合Bi-RNN，目標是通過前文預測下一單詞，不能將下文信息傳給模型。分類問題，手寫文字識別、機器翻譯、蛋白結構預測，Bi-RNN提升模型效果。百度語音識別，通過Bi-RNN綜合上下文語境，提升模型準確率。

Bi-RNN網絡結構核心，普通單向RNN拆成兩個方向，隨時序正向，逆時序反賂。當前時間節點輸出，同時利用正向、反向兩個方向信息。兩個不同方向RNN不共用state，正向RNN輸出state只傳給正向RNN，反向RNN輸出state只傳給反向RNN，正反向RNN沒有直接連接。每個時間節點輸入，分別傳給正反向RNN，根據各自狀態產生輸出，兩份輸出一起連接到Bi-RNN輸出節點，共同合成最終輸出。對當前時間節點輸出貢獻(或loss)，在訓練中計算出來，參數根據梯度優化到合適值。

Bi-RNN訓練，正反向RNN沒有交集，分別展開普通前饋網絡。BPTT(back-propagation through time)算法訓練，無法同時更新狀態、輸出。正向state在t=1時未知，反向state在t=T時未知，state在正反向開始處未知，需人工設置。正向狀態導數在t=T時未知，反向狀態導數在t=1時未知，state導數在正反向結晶尾處未知，需設0代表參數更新不重要。

開始訓練，第一步，輸入數據forward pass操作，inference操作，先沿1->T方向計算正向RNN state，再沿T->1方向計算反向RNN state，獲得輸出output。第二步，backward pass操作，目標函數求導操作，先求導輸出output，先沿T->1方向計算正向RNN state導數，再沿1->T方向計算反向RNN state導數。第三步，根據求得梯度值更新模型參數，完成訓練。

Bi-RNN每個RNN單元，可以是傳統RNN，可以是LSTM或GRU單元?？梢栽谝粚覤i-RNN上再疊加一層Bi-RNN，上層Bi-RNN輸出作下層Bi-RNN輸入，可以進一步抽象提煉特征。分類任務，Bi-RNN輸出序列連接全連接層，或連接全局平均池化Global Average Pooling，再接Softmax層，和卷積網絡一樣。

TensorFlow實現Bidirectional LSTM Classifier，在MNIST數據集測試。載入TensorFlow、NumPy、TensorFlow自帶MNIST數據讀取器。input_data.read_data_sets下載讀取MNIST數據集。

設置訓練參數。設置學習速率 0.01,優化器選擇Adam，學習速率低。最大訓練樣本數 40萬，batch_size 128,設置每間隔10次訓練展示訓練情況。

MNIST圖像尺寸 28x28,輸入n_input 28(圖像寬)，n_steps LSTM展開步數(unrolled steps of LSTM)，設28(圖像高)，圖像全部信息用上。一次讀取一行像素(28個像素點)，下個時間點再傳入下一行像素點。n_hidden(LSTM隱藏節點數)設256,n_classes(MNIST數據集分類數目)設10。

創建輸入x和學習目標y 的place_holder。輸入x每個樣本直接用二維結構。樣本為一個時間序列，第一維度時間點n_steps，第二維度每個時間點數據n_input。設置Softmax層weights和biases，tf.random_normal初始化參數。雙向LSTM，forward、backward兩個LSTM cell，weights參數數量翻倍，2*n_hidden。

定義Bidirectional LSTM網絡生成函數。形狀(batch_size,n_steps,n_input)輸入變長度n_steps列表，元素形狀(batch_size,n_input)。輸入轉置，tf.transpose(x,[1,0,2])，第一維度batch_size，第二維度n_steps，交換。tf.reshape，輸入x變(n_steps*batch_size,n_input)形狀。 tf.split，x拆成長度n_steps列表，列表每個tensor尺寸(batch_size,n_input)，符合LSTM單元輸入格式。tf.contrib.rnn.BasicLSTMCell，創建forward、backward LSTM單元，隱藏節點數設n_hidden，forget_bias設1。正向lstm_fw_cell和反向lstm_bw_cell傳入Bi-RNN接口tf.nn.bidirectional_rnn，生成雙向LSTM，傳入x輸入。雙向LSTM輸出結果output做矩陣乘法加偏置，參數為前面定義weights、biases。

最后輸出結果，tf.nn.softmax_cross_entropy_with_logits，Softmax處理計算損失。tf.reduce_mean計算平均cost。優化器Adam，學習速率learning_rate。tf.argmax得到模型預測類別，tf.equal判斷是否預測正確。tf.reduce_mean求平均準確率。

執行訓練和測試操作。執行初始化參數，定義一個訓練循環，保持總訓練樣本數(迭代數*batch_size)小于設定值。每輪訓練迭代，mnist.train.next_batch拿到一個batch數據，reshape改變形狀。包含輸入x和訓練目標y的feed_dict傳入，執行訓練操作，更新模型參數。迭代數display_step整數倍，計算當前batch數據預測準確率、loss，展示。

全部訓練迭代結果，訓練好模型，mnist.test.images全部測試數據預測，展示準確率。

完成40萬樣本訓練，訓練集預測準確率基本是1,10000樣本測試集0.983準確率。

Bidirectional LSTM Classifier，MNIST數據集表現不如卷積神經網絡。Bi-RNN、雙向LSTM網絡，時間序列分類任務表現更好，同時利用時間序列歷史和未來信息，結合上下文信息，結果綜合判斷。

import tensorflow as tf
import numpy as np
# Import MINST data
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)
# Parameters
learning_rate = 0.01
max_samples = 400000
batch_size = 128
display_step = 10
# Network Parameters
n_input = 28 # MNIST data input (img shape: 28*28)
n_steps = 28 # timesteps
n_hidden = 256 # hidden layer num of features
n_classes = 10 # MNIST total classes (0-9 digits)
# tf Graph input
x = tf.placeholder("float", [None, n_steps, n_input])
y = tf.placeholder("float", [None, n_classes])
# Define weights
weights = {
    # Hidden layer weights => 2*n_hidden because of foward + backward cells
    'out': tf.Variable(tf.random_normal([2*n_hidden, n_classes]))
}
biases = {
    'out': tf.Variable(tf.random_normal([n_classes]))
}
def BiRNN(x, weights, biases):
    # Prepare data shape to match `bidirectional_rnn` function requirements
    # Current data input shape: (batch_size, n_steps, n_input)
    # Required shape: 'n_steps' tensors list of shape (batch_size, n_input)

    # Permuting batch_size and n_steps
    x = tf.transpose(x, [1, 0, 2])
    # Reshape to (n_steps*batch_size, n_input)
    x = tf.reshape(x, [-1, n_input])
    # Split to get a list of 'n_steps' tensors of shape (batch_size, n_input)
    x = tf.split(x, n_steps)
    # Define lstm cells with tensorflow
    # Forward direction cell
    lstm_fw_cell = tf.contrib.rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
    # Backward direction cell
    lstm_bw_cell = tf.contrib.rnn.BasicLSTMCell(n_hidden, forget_bias=1.0)
    # Get lstm cell output
#    try:
    outputs, _, _ = tf.contrib.rnn.static_bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, x,
                                       dtype=tf.float32)
#    except Exception: # Old TensorFlow version only returns outputs not states
#        outputs = rnn.bidirectional_rnn(lstm_fw_cell, lstm_bw_cell, x,
#                                        dtype=tf.float32)
    # Linear activation, using rnn inner loop last output
    return tf.matmul(outputs[-1], weights['out']) + biases['out']

pred = BiRNN(x, weights, biases)
# Define loss and optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)
# Evaluate model
correct_pred = tf.equal(tf.argmax(pred,1), tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
# Initializing the variables
init = tf.global_variables_initializer()
# Launch the graph
with tf.Session() as sess:
    sess.run(init)
    step = 1
    # Keep training until reach max iterations
    while step * batch_size < max_samples:
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # Reshape data to get 28 seq of 28 elements
        batch_x = batch_x.reshape((batch_size, n_steps, n_input))
        # Run optimization op (backprop)
        sess.run(optimizer, feed_dict={x: batch_x, y: batch_y})
        if step % display_step == 0:
            # Calculate batch accuracy
            acc = sess.run(accuracy, feed_dict={x: batch_x, y: batch_y})
            # Calculate batch loss
            loss = sess.run(cost, feed_dict={x: batch_x, y: batch_y})
            print("Iter " + str(step*batch_size) + ", Minibatch Loss= " + \
                  "{:.6f}".format(loss) + ", Training Accuracy= " + \
                  "{:.5f}".format(acc))
        step += 1
    print("Optimization Finished!")
    # Calculate accuracy for 128 mnist test images
    test_len = 10000
    test_data = mnist.test.images[:test_len].reshape((-1, n_steps, n_input))
    test_label = mnist.test.labels[:test_len]
    print("Testing Accuracy:", \
        sess.run(accuracy, feed_dict={x: test_data, y: test_label}))

參考資料：
《TensorFlow實戰》

歡迎付費咨詢(150元每小時)，我的微信：qingxingfengzi

最后編輯于：2017.12.09 14:35:04

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,797評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,179評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事?！?“怎么了？”我有些...
開封第一講書人閱讀 175,628評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,642評論 1贊 309
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,444評論 6贊 405
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,948評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,040評論 3贊 440
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,185評論 0贊 287
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,717評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,602評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,794評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,316評論 5贊 358
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 44,045評論 3贊 347
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,418評論 0贊 26
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,671評論 1贊 281
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,414評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,750評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

學習筆記TF036:實現Bidirectional LSTM Classifier

學習筆記TF036:實現Bidirectional LSTM Classifier

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

學習筆記TF036:實現Bidirectional LSTM Classifier

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频