DT時代,大數據、BI和人工智能均是十分火熱的產業趨勢,而自然語言處理作為人工智能領域和計算機科學領域中的一個重要方向,也隨之火熱了一把,得到不少IT人士的極大研究興趣。現在,大圣眾包威客平臺(www.dashengzb.cn)推介若干本深入淺出的自然語言處理書籍。
《Foundations of Statistical Natural Language Processing》
用統計方法處理自然語言文本,在近年來已經占據了主導地位。《Foundations of Statistical Natural Language Processing》涵蓋了搭配發現、詞義消歧、概率解析、信息檢索和其他應用等內容。同時,它也對統計自然語言處理(NLP)進行了全面的介紹,并且包含了所有開發NLP工具所需的理論和算法。此書不但提供了廣泛且嚴格的數學和語言基礎的內容,還包括詳細的統計方法討論,讓學生和研究人員可以根據其實現自己的想法。
2.《自然語言處理簡明教程》
系統地闡述了自然語言處理的基本方法的《自然語言處理簡明教程》,描述了每一種方法的技術原理及操作過程。另外,此書還介紹了自然語言處理在各個領域的應用,讓讀者能夠掌握第一手的自然語言處理的前沿動態。作為在本領域十分著名的書籍,《自然語言處理簡明教程》不僅可供計算機科學工作者、人工智能領域工作者閱讀,還可供語言學及應用語言學的師生閱讀與參考。
3.《Speech and Language Processing, 2nd Edition》
《Speech and Language Processing, 2nd Edition》在古典自然語言處理、統計自然語言處理、語音識別、計算語言學和人類語言處理的本科或高級本科課程中,都有著十分崇高的地位。
基于Web語言技術的爆炸式發展,以及多領域的合并等,使得語言處理漸漸成為讓人深感興趣的科目。它也是第一本在所有層次和所有現代技術層面上,全面覆蓋語言技術的書,特別適用于大公司的應用統計方面以及其他機器學習算法領域。
4.《自然語言處理原理與技術實現》
《自然語言處理原理與技術實現》詳細介紹了自然語言處理以Java 實現的各主要領域的原理,當中包括中文分詞、詞性標注、依存句法分析等,更對中文分詞和詞性標注的過程及相關算法,如隱馬爾可夫模型等,進行了詳細的介紹。本書內容豐富,它在自然語言處理的應用中主要介紹了信息抽取、自動文摘、文本分類等領域的基本理論和實現過程,另外,還有問答系統、語音識別等目前應用非常廣泛的領域。值得注意的是,在問答系統的介紹中,《自然語言處理原理與技術實現》特地介紹了聊天機器人的實現過程,無論是從句子理解、句法分析、同義詞提取等方面,都深刻地揭示了聊天機器人的實現原理。
好的書單,不僅能夠提升學習和工作的效率,還能節省進修成本。自然語言處理研究,是實現人與計算機之間用自然語言進行有效通信的各種理論和方法。希望廣大對人工智能有興趣的人士閱讀此文后,略覺有所裨益。
原文地址:http://www.dashengzb.cn/articles/a-364.html
(更多大數據與商業智能領域干貨、或電子書,可添加個人微信號(dashenghuaer))