
邏輯回歸常見面試總結 一、基本知識 簡要介紹:邏輯回歸假設數(shù)據(jù)服從伯努利分布,通過極大似然函數(shù)的估計方法,運用梯度下降的方法來求解參數(shù),來達到將...
VS Code之Python環(huán)境配置 一、配置本地的python環(huán)境 1、安裝Anaconda3 在Anaconda官網(wǎng)下載最新版的Anacon...
Contextual Word Representations and Pretraining 一、Word Representations 在...
Subword Models 一、Morphology: Parts of words 在傳統(tǒng)上,我們通常將語素作為最小的語義單位。在深度學習中...
ConvNets for NLP 一、From RNNs to Convolutional Neural Nets RNN無法捕獲沒有前綴上下文...
QA 一般來說,問答系統(tǒng)的目的就是根據(jù)給定的問題給出相應的答案。我們可以將其分解為兩個步驟:1、查找(可能)包含答案的文檔;2、在段落或文檔中找...
機器翻譯與seq2seq 一、早期的機器翻譯 機器翻譯(MT)是將句子x從一種語言(源語言)翻譯成另一種語言(目標語言)的句子y的任務。機器翻譯...
RNN中的梯度消失問題 一、RNN中的梯度消失 1、梯度消失的影響 梯度消失是神經(jīng)網(wǎng)絡中比較常見也是比較嚴重的一個問題,在RNN中它會導致長距離...
語言模型和循環(huán)神經(jīng)網(wǎng)絡 一、語言模型 1、簡介 簡單來講,語言模型就是通過對預測接下來會出現(xiàn)什么詞這個任務建模得到的一個模型。下圖就是一個簡單的...