自然语言处理
Deep Learning 2|用Python進行自然語言處理的基礎理論實作 豆瓣
作者: 斎藤康毅 译者: 吳嘉芳 O'Reilly 2019 - 3
本書是《Deep Learning : 用Python進行深度學習的基礎理論實作》的續篇,將延續上一本書,繼續介紹與深度學習有關的技術。本書尤其偏重在自然語言處理及時間序列資料處理上,使用深度學習,挑戰各式各樣的問題。和上一本著作一樣,以「從零開始建構」為概念,詳盡介紹與深度學習有關的先進技術。
簡單來說,自然語言處理是指,讓電腦瞭解我們平常說話內容的技術。事實上,這種自然語言處理技術已經大大改變了我們的生活。在網頁搜尋、機械翻譯、語音助理等深深影響世界的技術根基中,已經使用了自然語言處理技術。本書把重點放在自然語言處理及時間序列資料處理上,學習在深度學習中,十分重要的技術。具體而言是指,word2vec、RNN、LSTM、GRU、seq2seq、Attention等技術。本書盡量使用淺顯易懂的說明,解說這些技術,並透過實際操作,確認你是否理解。此外,本書希望藉由實驗,讓你實際感受到這些技術的可能性。
Python自然语言处理 豆瓣
作者: (英)伯德 / (英)克莱因 东南大学出版社 2010 - 6
《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。
《Python自然语言处理(影印版)》将帮助你学习运用Python编程语言和自然语言工具包(NLTK)获得实用的自然语言处理技能。如果对于开发Web应用、分析多语言新闻源或记录濒危语言感兴趣——即便只是想从程序员视角观察人类语言如何运作,你将发现《Python自然语言处理》是一本令人着迷且极为有用的好书。
自然语言处理综论(第二版) 豆瓣 Goodreads
作者: 冯志伟 / Daniel Jurafsky(D. 朱夫斯凯) 译者: 冯志伟 / 孙乐 电子工业出版社 2018 - 3
从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。
本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 强调实用 注重评测 语料为本内容简介本书全面论述了自然语言处理技术。
本书在第一版的基础上增加了自然语言处理的最新成就,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书共分五个部分。第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。本书写作风格深入浅出,实例丰富,引人入胜。本书可作为高等学校自然语言处理或计算语言学的本科生和研究生的教材,也可以作为从事人工智能、自然语言处理等领域的研究人员和技术人员的必备参考。
文本数据挖掘 豆瓣
作者: 宗成庆 / 夏睿 2019 - 5
本书阐述文本数据挖掘的理论模型、实现算法和相关应用,主要内容包括:信息抽取和知识库构建、文本聚类、情感文本分析、热点发现、生物医学文本挖掘和多文档自动摘要等。写作风格力求言简意赅,深入浅出,通过实例说明实现相关任务的理论方法和技术思路,而不过多地涉及实现细节。本书可作为大学高年级本科生或研究生从事相关研究的入门文献,也可作为从事相关技术研发的开发人员的参考资料。