【RAG問答相關】復雜知識庫問答綜述(中)

前言

大模型落地應用過程中,一般形式還是問答形式,無論是人機對話還是機機對話,都是靠問答來解決一系列問題。無論是要求大模型給出具體的專業化知識,還是要求大模型進行某項作業的開展,都是以問題(指令其實也是一種特殊的問題)的形式進行。所以在RAG中,如何將問題轉化為大模型能夠理解的問題,轉化為各種知識庫可以查詢的問題,這是應用大模型能力的關鍵。本次帶來的東南大學發表的一篇關于KBQA相關的論文綜述。詳細介紹了復雜事實性問題的處理框架。我分為上中下三個部分詳解這篇論文中關于KBQA相關的內容。洞悉用戶問題才是大模型落地應用的第一步!本篇為中篇,主要講述了KBQA中基于語義解析的方法(SP_base)和基于信息檢索的方法(IR-base)。歡迎關注我們,大模型的藝術,持續更新!

【RAG問答相關】復雜知識庫問答綜述(上)【RAG問答相關】復雜知識庫問答綜述(中)

基于語義解析的方法

在這一部分我們討論基于語義解析方法的挑戰和解決辦法。

挑戰和解決方案的分類可以用圖4來顯示。

概述

基于SP的方法采用一種解析-執行過程,通過一系列模塊來實現,包括問題理解、邏輯解析、知識庫連接和知識庫執行。這些模塊在處理復雜的知識庫問答(KBQA)時面臨不同的挑戰。首先,當問題在語義和句法方面都較為復雜時,問題理解變得更加困難。其次,邏輯解析必須涵蓋復雜問題的多種查詢類型。此外,涉及更多關系和主題的復雜問題將顯著增加解析的可能搜索空間。第三,邏輯形式的手動標注成本高昂且勞動密集,使用弱監督信號(即問題-答案對)來訓練基于SP的方法具有挑戰性。在接下來的部分中,我們將介紹先前研究如何應對這些挑戰,并總結它們提出的高級技術。

理解復雜的語義和句法結構

作為基于SP方法的第一步,問題理解模塊將非結構化文本轉化為編碼的問題,這有助于下游的解析過程。與簡單問題相比,復雜問題具有組合語義和更復雜的查詢類型,這增加了語言分析的難度。

理解復雜問題的語義結構

復雜問題的復雜語義表明了句子之間的復雜依賴模式,這表達了各成分之間的關系。了解句子結構的核心部分有助于理解問題。將問題的結構屬性結合是實現這一目標的一種直觀策略。

將問題的結構屬性納入到seq2seq生成中。許多現有方法依賴于句法分析,例如依賴關系和抽象含義表示(AMR),以提供問題成分與邏輯形式元素(如實體、關系、實體類型和屬性)之間更好的對齊。這一研究方向在圖5的左側有所示。為了表示答案與問題中主題實體之間的遠距離依賴關系,Luo等人提取了它們之間的依賴路徑。通過編碼方向性依賴路徑,他們將句法特征和本地語義特征結合起來,形成全局問題表示。類似地,Abujabal等人利用依賴關系解析來處理組合性表達,并在創建查詢模板時僅關注由解析的依賴路徑包含的重要token。Abujabal等人沒有直接在依賴路徑上創建邏輯形式,而是利用依賴關系解析來分析表達方式的組合,并將其與邏輯形式對齊。Kapanipathi等人引入了AMR來幫助理解問題。其好處有兩個方面:(1)AMR在消除自然語言表達中的歧義方面很有效。(2)AMR解析模塊高度抽象,有助于以與知識庫無關的方式理解問題。然而,在復雜問題上,尤其是在存在長距離依賴的情況下,產生句法分析仍然不夠滿意。

為了緩解復雜問題的不準確句法分析,Sun等人利用基于骨架的分析來獲取復雜問題的主干,這是一個帶有幾個分支(即原始文本段的主要詞)的簡單問題,需要進一步擴展。例如,問題“What movie that Miley Cyrus acted in had a director named Tom Vaughan?”的主干是“What movie had a director?”,問題中的定語從句將被視為主干的分支。在這種骨架結構下,只有簡單問題需要進一步解析,這更有可能獲得準確的解析結果。

理解復雜查詢的復雜句法結構

通過分析復雜語義來理解問題非常重要。同樣,分析查詢的句法結構也至關重要,確保生成的邏輯形式能夠滿足復雜查詢的句法要求。雖然上述方法使用Seq2seq框架生成邏輯形式,但另一條研究路線(如圖5的右側所示)側重于利用結構屬性(例如邏輯形式的樹結構或圖結構)來對候選解析進行排名。

將邏輯形式的結構屬性納入特征化排名中。Maheshwari等人提出了一種新穎的排名模型,利用查詢圖的結構并使用注意權重來明確比較謂詞與自然語言問題。具體而言,他們提出了一種細粒度的槽匹配機制,用于在問題和核心推理鏈中的每個謂詞之間進行逐跳語義匹配。與捕捉問題和簡單關系鏈之間的語義相關性不同,Zhu等人關注了查詢的結構屬性,并進行了查詢-問題匹配的KBQA。他們使用了一個結構感知的編碼器來建模查詢中的實體或關系上下文,促進了查詢和問題之間的匹配。類似地,Zafar等人結合了兩個Tree-LSTM來建模問題的依賴解析樹和候選查詢的樹結構,并利用它們之間的結構相似性進行全面排名。

傳統方法采用狀態轉移策略生成候選查詢圖。由于這種策略忽略了查詢的結構,將生成大量無效的候選查詢。為了過濾掉這些查詢,Chen等人提出了預測問題的查詢結構,并利用結構限制候選查詢的生成。具體而言,他們設計了一系列操作,用于生成類型、數值操作符、謂詞和實體的占位符。然后,他們可以將這種未實例化的邏輯形式與知識庫進行關聯,并生成可執行的邏輯形式。

解析復雜查詢

為了生成可執行的邏輯形式,傳統方法首先利用現有的解析器將問題轉化為CCG推導,然后通過將謂詞和參數與知識庫中的關系和實體進行對齊,將其映射到SPARQL。由于本體不匹配問題,這種方法對于復雜問題來說是次優的。因此,為了進行準確的解析,需要利用知識庫的結構,在解析過程中進行與知識庫的連接。

通過預定義的查詢模版設計邏輯形式。為了滿足復雜問題的組合性,研究人員已經開發了多種表達能力強的邏輯形式作為解析目標。回顧在初步步驟中識別的主題實體,Bast等人從主題實體出發,設計了三個查詢模板作為解析目標。我們在圖6中列出了這三個查詢模板。前兩個模板返回距離主題實體“Titanic”1跳和2跳的實體。第三個模板返回距離主題實體兩跳,并受另一個實體的限制。后續研究集中于設計模板以回答時間性問題。雖然這種基于模板的方法可以成功解析幾種類型的復雜問題,但存在覆蓋范圍有限的問題。

采用靈活組合規則設計具有表達力的邏輯形式。為了設計更具表現力的邏輯形式,Yih等人提出了查詢圖作為具有表達力的解析目標。查詢圖是一種圖結構的邏輯形式,與知識庫模式密切匹配,是可執行SPARQL的替代品。它由實體、變量和函數組成,分別對應于問題中提到的基礎實體、查詢和聚合操作。如圖6所示,首先確定了一組從主題實體開始的核心推理鏈。然后,將約束實體和聚合運算符附加到路徑鏈上,使其適應更復雜的問題。與預定義的模板不同,查詢圖不受跳數和約束數的限制。它們已經表現出強大的能力來表達復雜問題,盡管它們仍然無法處理長尾復雜問題類型。基于對長尾數據樣本的更多觀察,后續工作試圖通過引入句法標注來增強查詢圖的結構復雜性,應用更多的聚合操作符,如合并、共指消解以適應復雜問題。與查詢模板相比,具有靈活組合規則的邏輯形式可以適用于各種復雜查詢。更具表現力的邏輯形式表示更強大的知識庫問答系統,可以處理更多樣化的問題。

在龐大的搜索空間下進行知識庫連接

為了獲得可執行的邏輯形式,知識庫連接模塊會將可能的邏輯形式與知識庫進行實例化。由于知識庫中的一個實體可能與數百甚至數千個關系相連,考慮到計算資源和時間復雜性,枚舉和連接復雜問題的所有可能邏輯形式是不可行的。

將復雜問題分解為子問題。研究人員嘗試提出方法,通過多個步驟生成復雜查詢,而不是通過單一遍歷來枚舉邏輯形式。鄭等人提出首先將復雜問題分解為多個簡單問題,其中每個簡單問題都被解析為一個簡單的邏輯形式。最終答案可以通過部分邏輯形式的連接或合成來獲得。這種分解-執行-連接策略可以有效縮小搜索空間。不過,布塔尼等人研究了一種類似的方法。由于將問題分解需要人工工作,他們通過增強的指針網絡減少了人工注釋,并通過識別組合計劃來獲得。最終答案是通過合并或組合分解問題的答案獲得。

通過迭代擴展邏輯形式。與將復雜問題分解為子問題不同,許多研究采用了擴展和排名策略,通過迭代方式擴展邏輯形式以減少搜索空間。具體而言,它們首次收集了與主題實體的1跳鄰域相關的所有查詢圖作為第一次迭代的候選邏輯形式。這些候選根據它們與問題的語義相似性進行排名。排名靠前的候選保留下來進行進一步擴展,而排名靠后的候選則被過濾掉。在隨后的迭代中,每個排名靠前的查詢圖都會進行擴展,從而產生了一組更復雜的候選查詢圖。此過程將一直重復,直到獲得最佳查詢圖。陳等人首次利用跳躍貪婪搜索來擴展最有可能的查詢圖。蘭等人提出了一個增量序列匹配模塊,以迭代方式解析問題,而不需要在每個搜索步驟中重新生成查詢圖。上述擴展是以線性方式進行的,只對生成多跳關系有效。蘭等人為每次迭代定義了三種擴展操作,分別對應多跳推理、約束關系和數值操作,分別是擴展、連接和聚合。圖7中的示例展示了這兩種策略的不同原理。

在弱監督信號下進行訓練

為了應對未標記的推理路徑問題,已經使用基于強化學習(RL)的優化方法來最大化預期獎勵。然而,訓練數據不足使得在弱監督下進行訓練成為一項挑戰。

使用稀疏獎勵進行訓練

通過RL進行訓練表明,基于SP的方法只能在完整解析邏輯形式之后才能獲得反饋。這導致了一個具有極度稀疏正獎勵的長時間探索階段。為了解決這個問題,提出了一些方法來增強最終獎勵或中間獎勵。

通過豐富的特征增強最終獎勵。一些研究工作采用獎勵塑造策略來進行解析評估。具體而言,研究人員通過將更多答案信息納入最終預測的豐富特征中來增加邏輯形式的獎勵。Saha等人在模型預測的答案具有與連接真相相同的類型時,獎勵模型附加的反饋。通過這種方式,即使模型預測的答案不完全等于連接真相,它們也可以鼓勵模型尋找正確的答案類型。這有助于避免探索階段出現稀疏正獎勵。

通過豐富的評論者增強中間獎勵。除了來自最終預測的獎勵之外,語義解析過程中的中間獎勵也可以幫助應對這一挑戰。最近,Qiu等人將查詢圖生成形式化為分層決策問題,并提出了一個基于選項的分層框架,為低級代理提供中間獎勵。通過在決策過程中設置選項,高級代理在中間步驟為低級代理設定目標。為了評估低級代理的中間狀態是否符合高級代理的目標,他們測量了給定問題和生成的三元組之間的語義相似性。為了為策略提供有效的中間反饋,Qiu等人使用手工制定的規則增強了查詢圖的評論者。

處理虛假推理

在訓練的早期階段,很難找到具有正獎勵的邏輯形式。此外,在早期階段的隨機探索很容易導致虛假推理,其中邏輯形式導致正確答案但在語義上不正確。因此,可以進行高質量邏輯形式的早期監督,以加速訓練并防止模型誤導虛假推理。

通過高獎勵邏輯形式穩定訓練過程。為了加速和穩定訓練過程,Liang等人提出了通過迭代最大似然訓練過程找到的偽黃金程序來引導訓練的方法。訓練過程包括兩個步驟:(1) 利用波束搜索機制找到偽黃金程序,以及(2) 在歷史上找到的最佳程序的監督下優化模型。Hua等人采用了類似的思路,通過將生成的邏輯形式與存儲在內存緩沖區中的高獎勵邏輯形式進行比較來評估邏輯形式。為了在開發和探索之間取得平衡,他們提出了接近獎勵和新奇獎勵,以鼓勵記住過去的高獎勵邏輯形式并生成新的邏輯形式以減輕虛假推理。將這種獎勵與終端獎勵結合起來,模型可以在學習過程中獲得密集的反饋。

基于信息檢索的方法

在本節中,我們總結了復雜問題對IR-based方法的不同模塊帶來的主要挑戰。這些挑戰和解決方案的分類可以通過下圖進行可視化。

概述

整個流程通常包括檢索源構建、問題表示、基于圖的推理和答案生成等模塊。這些模塊在處理復雜KBQA時會遇到不同的挑戰。首先,檢索源模塊從知識庫中提取一個與問題相關的圖,其中包括相關事實和大量的噪聲事實。由于源知識庫的不可忽視的不完整性,正確的推理路徑可能在提取的圖中不存在。在復雜問題的情況下,這兩個問題更容易出現。其次,問題表示模塊理解問題并生成指導推理過程的指令。當問題變得復雜時,這一步變得具有挑戰性。然后,通過語義匹配在圖上進行推理。在處理復雜問題時,這些方法通過語義相似性來對答案進行排名,而不在圖中進行可追蹤的推理,這阻礙了推理分析和故障診斷。

接下來的部分將闡述先前的工作是如何應對這些挑戰以及使用的先進技術。

在不完美的知識庫下進行推理

一般而言,基于信息檢索的方法通過在圖結構上進行推理來找到答案。這個圖結構通常是從知識庫中提取的一個與問題相關的圖。然而,由于知識庫的不完整性和啟發式圖生成策略帶來的噪聲圖上下文,這些問題特定的圖永遠不會是完美的。

在不完整的知識庫上進行推理

對于問題特定圖來說,獲得正確推理路徑的高召回率是至關重要的。由于簡單問題只需要在知識庫中的主題實體附近進行1跳推理,所以在解決簡單問題時,基于信息檢索的方法不太可能受到知識庫固有不完整性的影響。相比之下,復雜問題的正確推理路徑很可能不會出現在問題特定圖中,這將成為一個嚴重問題。為了解決這個挑戰,研究人員利用輔助信息來補充知識源。我們將不同的補充方法分為三類,并在圖9中展示它們的核心區別。

圖9. 說明了三種補充不完整知識庫的方法類別。所有子圖都是以自下而上的方式繪制的,輸入位于底部,補充的圖位于頂部。主題實體和答案實體分別以粗體和陰影框顯示。

用句子作為節點來補充不完整的知識庫。直觀地說,從維基百科中檢索到的大量與問題相關的文本語料庫可以提供廣泛的非結構化知識作為補充證據。基于這一觀察,Sun等人提出了使用額外的問題相關句子作為節點來補充圖,并在增強的異構圖上進行推理(即圖9左側)。根據句子中提到的實體,他們將它們與圖上的相應實體進行關聯并將它們視為節點。

通過文本信息增強實體表示。與直接將句子作為節點補充到問題特定圖中不同,熊等人和韓等人提出將額外的文本信息融合到實體表示中作為第二種方式(如圖9中間所示)。熊等人設計了一種新穎的條件門控機制,在子圖閱讀器提取的與文本鏈接的實體表示的指導下,獲得了句子的知識感知信息。這些句子的知識感知信息進一步被聚合以增強實體表示,以補充不完整的知識庫。類似地,韓等人將句子的文本信息融合到實體表示中。在他們的設置中,每個句子被視為連接所有涉及實體的超邊,一個文檔可以被視為一個超圖。基于超圖卷積網絡(HGCN)[95],他們對文檔中的句子進行編碼,并將句子表示融合到句子鏈接的實體表示中。

用預訓練的知識庫嵌入來補充不完整的圖。在知識庫補全(knowledge base completion ,KBC)任務中,知識庫嵌入已經被采用來通過執行缺失鏈接預測來減輕知識庫的稀疏性。受此啟發,Apoorv等人利用了預訓練的知識庫嵌入來解決不完整的知識庫問題,如圖9右側所示。具體而言,他們使用ComplEX方法預訓練了知識庫嵌入(即實體和關系嵌入),并通過一個三元組評分函數來預測答案,該函數將三元組(主題實體、問題、答案實體)作為輸入。為了使問題適應原始的ComplEX評分函數,他們將問題的Roberta嵌入映射到相同維度的復數空間中。通過利用全局知識庫的預訓練知識,他們隱式地補充了不完整的問題特定圖。

處理嘈雜的圖上下文

由于問題特定圖通常是使用啟發式方法構建的,它可能引入冗余甚至與問題無關的嘈雜圖上下文(包括實體和句子節點)。與只需要1跳推理的簡單問題相比,為復雜問題構建的問題特定圖更有可能包含嘈雜的圖上下文。在這樣的嘈雜圖上進行推理對于復雜問題構成了巨大的挑戰,同時也降低了模型訓練的效率。

構建精確的問題特定圖。一個直觀的想法是構建一個相對小而精確的圖以進行后續推理。為了實現這個目標,Sun等人提出了在主題實體和答案實體之間的最短路徑監督下,通過迭代檢索和推理過程構建異構圖。在最近的研究中,Zhang等人提出了一個可訓練的子圖檢索器(SR),用于檢索相關的關系路徑以進行后續推理。他們的實驗結果證明,這樣的精確圖可以為基于信息檢索的方法帶來顯著的性能提升。

在推理過程中過濾掉無關信息。除了為后續推理構建小而精確的圖外,一些研究工作還提出在推理過程中過濾掉無關信息。注意力機制,對于消除無關特征非常有效,已被現有的基于信息檢索的方法采用,以在推理過程中保留相關信息。類似地,Yasunaga等人采用了每個節點的預訓練語言模型評分,條件是問題回答上下文作為相關性分數,以引導后續推理過程。

理解復雜語義

理解復雜問題是后續推理的前提。然而,復雜問題包含復合語義,并需要特定的知識(例如命名實體、序數推理)來回答。由于復雜問題具有這種固有屬性,專為簡單問題理解設計的方法可能不適用于復雜問題。

理解復合語義

基于信息檢索的方法通常通過神經網絡(例如,LSTM和GRU)直接將問題編碼為低維向量來生成初始問題表示q。通過上述方法獲得的靜態推理指令(例如,q的最終隱藏狀態)無法有效表示復雜問題的復合語義,這對于指導問題特定圖上的推理構成了挑戰。為了全面理解問題,一些研究在推理過程中動態更新推理指令。

使用注意力在不同語義上逐步指導。為了使推理模型能夠了解推理步驟,Qiu等人提出通過使用單層感知器將初始問題表示q轉化為具有步驟感知性的表示。在獲得具有步驟感知性的問題表示之后,進一步引入了注意力機制,以選擇有用的信息生成指導向量。類似地,He等人提出使用動態注意力機制關注問題的不同部分。基于具有步驟感知性的問題表示和先前的推理指令,他們生成了對問題的標記的注意力分布,并更新了指導向量。

使用推理上下文信息更新指導信息。除了通過注意力明確記錄問題的分析部分之外,還有一些其他方法提出使用在推理過程中檢索到的信息更新指導信息。一個典型的例子是生成明確的推理路徑并使用生成的路徑更新指導。Zhou等人設計了一個模型,該模型以當前的推理指導作為輸入,然后從知識庫中的所有關系中預測中間關系。在獲得預測的關系后,模型將指導向量更新為:,其中減法是指從問題中省略已分析信息。因此,在后續推理過程中,更新后的推理指導可以保存問題的未分析部分。

與生成明確的推理路徑不同,Xu等人和Miller等人采用了鍵-值記憶網絡來實現類似的動態指導更新。具體來說,他們首先將包含一個主題實體作為主語的所有知識庫事實包含到內存中。然后,他們索引鍵-值內存中的鍵和值,其中鍵是(主語,關系)對,值是相應的客體實體。通過進行鍵尋址過程,以找到最適合的鍵和相應值來指導。使用已尋址的鍵和值,他們將其表示與先前步驟的推理指導連接,并執行線性轉換以獲得更新后的推理指導,以指導下一跳推理。通過這種方式,推理指導將在內存中得到更新。基于圖神經網絡的聯合推理。除了指導更新,另一類研究通過基于圖神經網絡(GNN)的推理來解決這種復合語義。Sun等人提出了一種基于GNN的模型GraftNet,用于在異構信息源上推理復雜問題。通過迭代的GNN推理步驟,實體表示和推理指導依次得到更新。推理指導傳達了主題實體的知識,它在推理過程中動態更新。盡管推理指導和圖神經網絡的迭代更新,Yasunaga等人提出了QAGNN模型,該模型通過單一圖神經網絡進行復雜問題的推理。他們在問題特定圖中構建了一個額外的問答上下文節點,該節點與圖中的所有其他節點相連。所有節點都使用預訓練語言模型(PLM)統一編碼為初始表示,并隨著圖神經網絡推理而得到更新。

知識表示

除了組合語義之外,復雜問題可能還包含知識密集型的標記或短語(例如命名實體、序數約束),這會阻礙基于文本的語義理解。除了問題文本之外,外部知識被作為輸入來幫助理解這些復雜問題。

注入有知識的實體表示。在自然語言問題中,主題實體通常是命名實體,但這些實體通常不足以提供足夠的信息來理解問題。為了處理這些命名實體,一些現有的工作提出了從知識庫中獲取的更具信息性的表示形式。作為一個典型例子,熊等人提出了從主題實體的圖上下文中學到的知識表示,以在潛在空間中重新構建查詢表示。通過一項消融研究,他們驗證了將這種有知識的表示注入到問題表示中的有效性。類似的想法也被采用在增強知識的語言模型預訓練中。雖然可以使用流行的seq2seq文本生成框架生成自然答案,但直接從標記詞匯表中生成命名實體仍然很困難。為了彌補這一差距,何等人首次提出了一種復制和檢索機制,用于從問題特定圖中的問題標記和實體的額外詞匯生成自然答案。類似的想法也被引入了知識增強型語言模型預訓練中,將關系事實輸入到結構化記憶槽中,作為生成命名實體的額外詞匯,并使用基于注意力的信息融合生成有知識的表示。

注入有知識的數值推理表示。雖然已經提出了多種解決多跳推理的方法,但很少關注解決具有數值運算的復雜問題。為了賦予基于信息檢索的方法數值推理能力,馮等人提出將數值屬性(即數字的大小和序數屬性)編碼到實體表示中。首先,他們手動定義了一系列序數限定詞(例如,第一個,最大的)來檢測序數約束問題。對于這些檢測到的問題,他們使用額外的數值屬性三元組來豐富其問題特定圖。通過使用預訓練的數字編碼模塊對這些數值屬性三元組進行編碼,額外的數值嵌入可以用作模型無關的插件,用于基于信息檢索的方法進行數值推理。

無法解釋的推理

由于復雜問題通常按順序查詢多個事實,系統應該能夠基于可追溯的推理過程在圖上準確預測答案。盡管神經網絡非常強大,但推理模塊的黑盒風格使得推理過程難以解釋,也難以引入用戶交互以進一步改進。為了獲得更可解釋的推理過程,推理是通過多步中間預測來執行的。在推理過程中,KBQA模型生成一系列推理狀態,盡管最終狀態用于生成答案預測,但中間狀態可能有助于生成中間預測(即匹配的關系或實體),以提高可解釋性。更重要的是,中間預測使得通過用戶交互更容易檢測到虛假或錯誤的推理。

解釋復雜推理與關系路徑。現有研究采用不同的推理狀態和推理模塊設計來解釋推理過程。具體而言,Zhou等人將多跳推理過程形式化為關系序列生成,并使用向量表示推理狀態。對于每一步,指令向量和狀態向量與關系候選進行匹配,生成關于知識庫中所有關系的概率分布。然后,加權的關系表示被用來更新狀態。通過重復這個過程,模型可以實現可解釋的推理過程。受到上述工作的啟發,Han等人提出了基于超圖卷積網絡(HGCN)的可解釋模型,用于預測解釋的關系路徑。他們通過確定一組通過相同關系連接的實體構建了一個密集的超圖,模擬了人類的跳躍關系推理。為了訓練這兩個模型,他們利用了黃金關系路徑。然而,在大多數情況下,黃金關系路徑的注釋是不可用的,這使得他們的方法不適用于一般數據集。解釋復雜推理與中間實體。除了關系路徑之外,一些研究工作在中間步驟預測與問題相關的實體,以解釋多跳推理過程。Xu等人精心采用了鍵值記憶網絡來實現可追溯的推理過程。在他們的工作中,狀態被定義為值表示的加權和,其權重來自鍵-指令匹配。為了預測中間實體,他們的模型采用傳統的基于信息檢索的方法來給定查詢對候選進行評分。由于虛假的長路徑可能連接主題實體與知識庫中的答案實體,在訓練過程中,他們提出使用最終答案來監督中間實體的預測。這樣的目標鼓勵模型生成最短的推理路徑。除了明確生成中間實體,He等人提出生成中間實體分布來指示推理過程。他們的實驗結果還顯示,這種中間監督信號可以有效減少虛假推理。

在弱監督信號下訓練

與基于SP(Semantic Parsing)方法類似,對于基于信息檢索(IR)的方法來說,在中間步驟沒有任何注釋的情況下推理出正確答案是困難的,因為模型無法在推理結束之前接收到任何反饋。研究發現,這種情況可能導致虛假推理。由于缺乏中間狀態的監督信號,來自虛假推理的獎勵可能會誤導模型。中間反饋的獎勵塑形策略。為了在弱監督信號下訓練模型,Qiu等人將基于知識庫的多跳推理過程形式化為在圖上擴展推理路徑的過程。基于編碼的決策歷史,策略網絡利用了注意機制,以關注給定問題的不同部分對三元組選擇的獨特影響。為了緩解由弱監督信號引起的延遲和稀疏獎勵問題,他們采用了獎勵塑形策略來評估推理路徑并提供中間獎勵。具體來說,他們利用問題和關系路徑之間的語義相似性來評估中間步驟的推理狀態。

學習偽中間監督信號。除了在中間步驟評估推理狀態之外,一個更直觀的想法是推斷偽中間狀態,并用這些推斷的信號增強模型的訓練。受到圖上雙向搜索算法的啟發,He等人提出了使用雙向推理過程學習和增強中間監督信號的方法。將實體分布作為中間步驟的適當監督信號,他們提出在師生框架下學習和利用這些信號。

增強監督信號的多任務學習。雖然大多數現有工作都集中在增強中間步驟的監督信號上,但很少關注實體鏈接步驟。大多數現有工作使用現成的工具來定位問題中的主題實體,導致錯誤傳播。為了在沒有注釋的情況下準確定位主題實體,Zhang等人提出了通過變分學習算法來訓練實體鏈接模塊,該模塊共同建模主題實體識別和隨后的知識庫推理。他們還應用了具有方差減少技術的REINFORCE算法,以使系統具備端到端的可訓練性。

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,367評論 6 532
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,001評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,213評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,535評論 1 308
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,317評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,868評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,963評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,090評論 0 285
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,599評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,549評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,712評論 1 367
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,233評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,961評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,353評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,607評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,321評論 3 389
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,686評論 2 370

推薦閱讀更多精彩內容