自然语言处理
自然语言计算机形式分析的理论与方法 豆瓣
作者: 冯志伟 出版社: 中国科学技术大学出版社 2017 - 1
自然语言计算机形式分析是横跨语言学、计算机科学和数学的一个交叉研究领域,是自然语言计算机处理的关键。自然语言是信息主要的负荷者,在当今信息网络时代,计算机已经日益普及,普通计算机用户可以使用的语言资源正以惊人的速度飞快增长。互联网主要是由自然语言构成的,它已经成为了极为丰富的语言信息资源;移动通信也是以自然语言为媒介的,它已经渗透到日常生活的各个领域。因此,自然语言计算机形式分析对于国家的信息化建设,对于互联网和移动通信的安全具有重要作用。
本书对自然语言处理中的各种理论和方法进行了系统的总结和梳理。首先讨论了自然语言处理的学科定位;接着介绍了语言计算的一些先驱研究;然后以主要的篇幅讨论自然语言处理中的各种形式模型,包括基于短语结构语法的形式模型、基于合一运算的形式模型、基于依存和配价的形式模型、基于格语法的形式模型、基于词汇主义的形式模型、语义自动处理的形式模型、系统功能语法、语用自动处理的形式模型、概率语法、Bayes公式与动态规划算法、N元语法和数据平滑、隐Markov模型(HMM)、语音自动处理的形式模型、统计机器翻译的形式模型;同时还讨论了自然语言处理系统的评测问题;*后从哲学的角度讨论了自然语言处理中的理性主义和经验主义,探索理性主义方法和经验主义方法相结合的途径。
本书说理透彻、语言流畅、实例丰富、深入浅出,适合从事自然语言处理研究的科研人员、大学师生阅读,也可以作为人工智能、计算语言学等课程的教学参考书。
2020年10月17日 已读
一直拿来垫电脑了没好好看,最近学习几个理论发现冯老这本都有好好讲了,冯老还是一如既往广博得很啊。
NLP nobutdunbuy 冯志伟 形式句法 思维
Speech and Language Processing, 2nd Edition 豆瓣 Goodreads
10.0 (5 个评分) 作者: Daniel Jurafsky / James H. Martin 出版社: Prentice Hall 2008 - 5
This is the 2nd edition of "Speech and Language Processing, 2000" (http://www.douban.com/subject/1810715/).
An explosion of Web-based language techniques, merging of distinct fields, availability of phone-based dialogue systems, and much more make this an exciting time in speech and language processing. The first of its kind to thoroughly cover language technology – at all levels and with all modern technologies – this book takes an empirical approach to the subject, based on applying statistical and other machine-learning algorithms to large corporations. Builds each chapter around one or more worked examples demonstrating the main idea of the chapter, usingthe examples to illustrate the relative strengths and weaknesses of various approaches. Adds coverage of statistical sequence labeling, information extraction, question answering and summarization, advanced topics in speech recognition, speech synthesis. Revises coverage of language modeling, formal grammars, statistical parsing, machine translation, and dialog processing. A useful reference for professionals in any of the areas of speech and language processing.
自然语言信息处理的逻辑语义学研究 豆瓣
作者: 邹崇理 出版社: 科学出版社 2018 - 9
自然语言的逻辑语义学(简称逻辑语义学)是依据现代逻辑的思想或采用现代逻辑的工具研究自然语言的句法生成尤其是语义组合规律的学科,是实现自然语言计算机信息处理的先期工作。《BR》  本书以汉语信息处理为导向,以现代汉语中的反身代词、照应省略结构、话题句、兼语句、连动句、复杂谓词并列结构等具有典型性的句法-语义现象为研究素材,展开了一系列逻辑语义学的研究,即针对汉语独有特征的范畴类型逻辑以及组合范畴语法的研究。这些研究一方面可以充实逻辑语义学研究的理论宝库,促进现代逻辑的发展;另一方面也能够为汉语的计算机信息处理提供理论指导。通过把逻辑语义学对自然语言,尤其是对汉语形式化研究的成果应用到汉语的信息处理领域,我国计算机自然语言处理的思路将得到拓宽,效率将得到提高。
语言·意义·指称 豆瓣
作者: 叶闯 出版社: 北京大学出版社 2010 - 4
这是一本有原创性的著作。意义与指称问题是分析哲学乃至整个哲学的一个具有根本重要性的问题,它是哲学领域中其他问题和讨论的概念基础。长期以来,在意义理论中占统治地位的观念,都把指称解释为语言与世界中对象的关系,并据此而把意义与世界联系起来。传统观念在理论上造成一系列困难,不能解决虚构对象的名字等诸多语言现象。本书针对过去流行理论的困难,而提出一种解决方案,它力图重新解释指称概念,并由此而解释意义对指称的直接决定作用。在此方案之下,意义与世界的关系不再是一种直接的概念关系,而是一种发生学的关系。这个分析的结果同时修改了弗雷格关于意义决定指称的理论,从而确定了意义所具有的自主的性质。本书从对当代语言哲学的主流观念的分析入手,提出了对于指称问题,指称与意义的关系问题,分析性概念的性质问题,意义本身的性质问题等一系列基本的主张,这些主张建立在语言相对于世界的自主性质的基础之上。对于意义与指称概念的不同于传统的解释,引出对真理,对语言的历史发生,对语言的社会性等的重新理解。它的直接结果将使哲学中困扰人们多年的否定存在问题等等,有了不同于传统的解释的可能。
自然语言处理综论(第二版) 豆瓣 Goodreads
作者: 冯志伟 / Daniel Jurafsky(D. 朱夫斯凯) 译者: 冯志伟 / 孙乐 出版社: 电子工业出版社 2018 - 3
从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。
本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 强调实用 注重评测 语料为本内容简介本书全面论述了自然语言处理技术。
本书在第一版的基础上增加了自然语言处理的最新成就,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书共分五个部分。第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。本书写作风格深入浅出,实例丰富,引人入胜。本书可作为高等学校自然语言处理或计算语言学的本科生和研究生的教材,也可以作为从事人工智能、自然语言处理等领域的研究人员和技术人员的必备参考。
自然语言生成系统的建造 豆瓣
作者: 雷特//戴尔 出版社: 北京大学 2010 - 8
《自然语言生成系统的建造》介绍怎样来建造一个自然语言生成系统。自然语言生成系统是一个计算机软件系统,它使用人工智能和计算语言学的方法和技术,自动地生成可理解的自然语言文本,这样的文本可以是独立的,也可以是多媒体文档的一个组成部分。自然语言生成系统要从某种非语言表达出发,以这种非语言表达作为信息的输入,使用语言知识和应用系统领域的知识,自动地产生出文档、报告、说明书、帮助信息以及其他类型的文本。
语音与语言处理 豆瓣
Speech and Language Processing
作者: Daniel Jurafsky / James H. Martin 出版社: 人民邮电出版社 2010
本书是第一本从各个层面全面介绍语言技术的书,自第1版出版以来,一直好评如潮,被国外许多著名大学选为自然语言处理和计算语言学课程的主要教材。本书将深入的语言分析与健壮的统计方法结合起来,新版更是涉及了大量的现代技术,将自然语言处理、计算语言学以及语音识别等内容融合在一本书中,把各种技术相互联系起来,让读者了解怎样才能最佳地利用每种技术,怎样才能将各种技术结合起来使用。本书写作风格引人入胜,深入技术细节而又不让人感觉枯燥。
本书不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,对于自然语言处理相关领域的研究人员和技术人员也是不可或缺的权威参考书。
基于认知的汉语计算语言学研究 豆瓣
作者: 袁毓林 出版社: 北京大学出版社 2008
陆序
冯序
一、计算理论和语言研究
计算语言学的理论方法和研究取向
基于统计的语言处理模型的有用性和局限性
认知科学和汉语计算语言学
面向当代科技的语言研究的理论和方法
二、论元结构和描述框架
论元角色的层级关系和语义特征
一套汉语动词的论元角色的语法指标
汉语谓词的论元结构的描述框架
论元结构和句式结构互动的动因、机制和条件——表达精细化对动词配价和句式构造的影响
三、信息抽取和语义标注
信息抽取的语义知识资源研究
用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法
用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用
基于论元结构的语义标注的体系和规范
新闻语体真实文本的语义标注的实践
四、专题研究和个案分析
容器隐喻和套件隐喻及相关的语法现象——词语同现限制的认知解释和计算分析
关于分词规范和规范词表的若干意见
中文信息处理中的语言难题问答
缓冲式移动通信及其发展方向 ——一个语言学家的设计思想
走向多层面互动的汉语研究
五、附录
赵元任先生评传
朱德熙先生评传
后记
自然语言交流的计算机模型 豆瓣
作者: 罗兰德·豪塞尔 译者: 冯秋香 出版社: 商务印书馆 2016 - 3
作者是德国爱尔兰根-纽伦堡大学的计算语言学教授,先后出版了多部计算机语言学专著。是左结合语法的创始人,后进一步提出数据库语义学和语表组合性内部匹配理论,在计算语言学界有卓越的建树。为国内计算机语言学的研究提供了很好的先例。
如果我们能够直接和计算机对话,而不是必须编写程序,那么我们的日常生活就会简单很多。但是,在能制造出这样会说话的机器人之前,首先要有一个关于自然语言交流如何进行的理论。
《自然语言交流的计算机模型》第一部分是对人工智能主体的高层次描述,人们可以用自己熟悉的语言和这个人工智能主体自由交谈。第二部分分析了自然语言的主要结构,也就是说者和听者模式下的命题内和命题间函词论元结构、并列结构及共指关系。第三部分定义了用Java实现的英语片段的陈述性规范说明。学者、研究生及软件工程师们可以在这个理论柜架下开展有关自然语言交流的理论分析,进行有关自然语言处理的各种实践。
The Handbook of Computational Linguistics and Natural Language Processing (Blackwell Handbooks in Linguistics) 豆瓣
作者: Clark, Alexander; Fox, Chris; Lappin, Shalom 出版社: Wiley-Blackwell 2010 - 8
This comprehensive reference work provides an overview of the concepts, methodologies, and applications in computational linguistics and natural language processing (NLP). Features contributions by the top researchers in the field, reflecting the work that is driving the discipline forward Includes an introduction to the major theoretical issues in these fields, as well as the central engineering applications that the work has produced Presents the major developments in an accessible way, explaining the close connection between scientific understanding of the computational properties of natural language and the creation of effective language technologies Serves as an invaluable state-of-the-art reference source for computational linguists and software engineers developing NLP applications in industrial research and development labs of software companies
The Language of Metaphors; Literal Metaphorical 豆瓣
作者: ANDREW GOATLY 出版社: Routledge 1997 - 6
In this ambitious and wide-ranging text, Andrew Goatly explores the language of metaphor. Combining insights from relevance theory and functional linguistics, he provides a powerful model for understanding how metaphors work in real communicative situations, how we use them to communicate meaning as well as how we process them.

Examining the distinction between literal and metaphorical language, Goatly surveys the means by which metaphors are realized in texts and locates the interpretation of metaphor in its social context. The Language of Metaphors is enlivened by the choice, variety and humor of its real examples which are taken from a wide variety of genres including conversation, popular science, advertising, news reports, novels and poetry. Supplemented with exercises and a suggested reading list, this book will provide students of language, psychology and literature with an invaluable guide to understanding precisely how metaphors function.</P>
多语自然语言处理 豆瓣
Multilingual Natural Language Processing Applications
作者: Daniel M. Bikel / Imed Zitouni 出版社: 机械工业出版社 2015 - 2
本书是第一本全面阐述如何构建健壮和准确的多语自然语言处理系统的图书,由两位资深专家编辑,集合了该领域众多尖端进展以及从广泛的研究和产业实践中总结出的实用解决方案。第一部分介绍现代自然语言处理的核心概念和理论基础,展示了如何理解单词和文档结构、分析语法、建模语言、识别蕴涵和检测冗余。第二部分彻底阐述与构建真实应用有关的实际考量,包括信息抽取、机器翻译、信息检索、文摘、问答、提炼、处理流水线等。
统计机器翻译 豆瓣
作者: 菲利普·科恩 译者: 宗成庆 / 张霄军 出版社: 电子工业出版社 2012 - 9
《国外计算机科学教材系列:统计机器翻译》提供了必要的语言学和概率论基础知识,涵盖了机器翻译的主要模型:基于词的、基于短语的和基于句法树的模型,还介绍了机器翻译评测、语言建模、区分式训练以及整合语言学标注的高级方法。《国外计算机科学教材系列:统计机器翻译》汇总了最新的研究成果和一些尚未解决的挑战,使初学者和经验丰富的研究人员都能够对这一领域有所贡献。这是一本本科生和研究生的理想读本,也适用于任何对机器翻译开发有兴趣的读者。
统计自然语言处理(第2版) 豆瓣
作者: 宗成庆 出版社: 清华大学出版社 2013 - 8
《中文信息处理丛书:统计自然语言处理(第2版)》全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、篇章分析、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
《中文信息处理丛书:统计自然语言处理(第2版)》可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
语言与认知的空间 豆瓣
作者: (荷兰)Stephen C.Levinson 出版社: 世界图书出版公司,剑桥大学出版社 2008
著名语言学家Stephen C。Levinson的语用学理论我国已多有介绍和评述。从20世纪90年代开始,Levinson的兴趣又转向了空间认知及思维和语言的关系等领域,先后发表一系列关于空间认知的文章。<语言和认知空间--认知多样性探索>就是他近10年来对语言和空间认知关系进行研究的重要成果。该书涉及人类学、语言学和心理学等多种学科,通过对多种语言和文化中的认知模式进行探讨,确认语言和认知空间之间存在很强的相互联系。全书共七章,我们逐一简述。
导读
原书目录
插图列表
表格列表
前言
致谢
第一章 知识背景:西方空间概念两千年
第二章 参照框架
第三章 语言的多样性
第四章 绝对心理
第五章 心理多样性
第六章 超越语言:寻找路径和指明方向的参照框架
第七章 语言与思维
注释
参考列表
语言索引
作者索引
主题索引
依存语法的理论与实践 豆瓣
作者: 刘海涛 出版社: 科学出版社 1991
《依存语法的理论与实践》的主要目的是,在充分了解前人有关依存关系、配价理论、依存形式化和依存句法分析方法的基础上,归纳出依存语法和配价理论的一般原理和方法,提出一套较完整的基于配价模式的依存语法分析框架,并用实验来证明这一框架的可行性。与此同时,我们也力图用《依存语法的理论与实践》提出的理论架构作为主线,将相关领域的主要研究成果串在一起,形成一部配价理论和依存语法研究的简史。
为了让国内读者更好地了解依存语法的一些基本思想和方法,《依存语法的理论与实践》在介绍其他学者的观点时,尽可能采用“引”而非“述”的方式,目的是为了更好地表现原义,减少误读率。在写作过程中,我们尽可能采用第一手的文献,所引外文资料一般均由作者自译。在计算语言学方法方面,《依存语法的理论与实践》对基于规则的方法和基于统计的方法都给予了足够的重视。理论求高、应用求实,是《依存语法的理论与实践》的基本方针。
2017年2月24日 已读
一本300多页的书内容那么丰富,横向纵向都有了。把配价和深度学习放一块,不知道会不会有好的效率。刘先生自己做的汉语的树库毕竟小,实践起来得更大的树库。不过现在机器翻译好像确实都基于统计,语言学家要加油实践和投入市场啊。
NLP 依存语法 句法分析 数理语言学 自然语言处理