计算语言学
Language, Cognition, and Computational Models 豆瓣
出版社: Cambridge University Press 2017 - 10
How do infants learn a language? Why and how do languages evolve? How do we understand a sentence? This book explores these questions using recent computational models that shed new light on issues related to language and cognition. The chapters in this collection propose original analyses of specific problems and develop computational models that have been tested and evaluated on real data. Featuring contributions from a diverse group of experts, this interdisciplinary book bridges the gap between natural language processing and cognitive sciences. It is divided into three sections, focusing respectively on models of neural and cognitive processing, data driven methods, and social issues in language evolution. This book will be useful to any researcher and advanced student interested in the analysis of the links between the brain and the language faculty.
The Computational Nature of Language Learning and Evolution 豆瓣
作者: Partha Niyogi 出版社: The MIT Press 2006 - 4
The nature of the interplay between language learning and the evolution of a language over generational time is subtle. We can observe the learning of language by children and marvel at the phenomenon of language acquisition; the evolution of a language, however, is not so directly experienced. Language learning by children is robust and reliable, but it cannot be perfect or languages would never change—and English, for example, would not have evolved from the language of the Anglo-Saxon Chronicles. In this book Partha Niyogi introduces a framework for analyzing the precise nature of the relationship between learning by the individual and evolution of the population.
Learning is the mechanism by which language is transferred from old speakers to new. Niyogi shows that the evolution of language over time will depend upon the learning procedure—that different learning algorithms may have different evolutionary consequences. He finds that the dynamics of language evolution are typically nonlinear, with bifurcations that can be seen as the natural explanatory construct for the dramatic patterns of change observed in historical linguistics. Niyogi investigates the roles of natural selection, communicative efficiency, and learning in the origin and evolution of language—in particular, whether natural selection is necessary for the emergence of shared languages.
Over the years, historical linguists have postulated several accounts of documented language change. Additionally, biologists have postulated accounts of the evolution of communication systems in the animal world. This book creates a mathematical and computational framework within which to embed those accounts, offering a research tool to aid analysis in an area in which data is often sparse and speculation often plentiful.
汉语名词短语和动词短语的自动识别方法研究 豆瓣
作者: 李荣 / 曹建芳 出版社: 北京燕山出版社 2008 - 6
《汉语名词短语和动词短语的自动识别方法研究》面向中文信息处理的实际需要,介绍了用规则方法识别汉语名词短语和动词短语的过程,然后介绍了用隐马尔可夫模型识别汉语名词短语,用支持向量机识别汉语动词短语的过程。在此基础上,探讨了解决计算机分析汉语短语结构碰到的各类歧义问题的途径。短语识别是中文信息处理领域的一个重要组成部分。《汉语名词短语和动词短语的自动识别方法研究》可作为高等院校计算机专业高年级学生的教学参考书,也可供从事中文信息处理及人工智能研究的相关人员参考。
Speech and Language Processing, 2nd Edition 豆瓣 Goodreads
10.0 (5 个评分) 作者: Daniel Jurafsky / James H. Martin 出版社: Prentice Hall 2008 - 5
This is the 2nd edition of "Speech and Language Processing, 2000" (http://www.douban.com/subject/1810715/).
An explosion of Web-based language techniques, merging of distinct fields, availability of phone-based dialogue systems, and much more make this an exciting time in speech and language processing. The first of its kind to thoroughly cover language technology – at all levels and with all modern technologies – this book takes an empirical approach to the subject, based on applying statistical and other machine-learning algorithms to large corporations. Builds each chapter around one or more worked examples demonstrating the main idea of the chapter, usingthe examples to illustrate the relative strengths and weaknesses of various approaches. Adds coverage of statistical sequence labeling, information extraction, question answering and summarization, advanced topics in speech recognition, speech synthesis. Revises coverage of language modeling, formal grammars, statistical parsing, machine translation, and dialog processing. A useful reference for professionals in any of the areas of speech and language processing.
自然语言处理综论(第二版) 豆瓣 Goodreads
作者: 冯志伟 / Daniel Jurafsky(D. 朱夫斯凯) 译者: 冯志伟 / 孙乐 出版社: 电子工业出版社 2018 - 3
从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。
本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 强调实用 注重评测 语料为本内容简介本书全面论述了自然语言处理技术。
本书在第一版的基础上增加了自然语言处理的最新成就,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书共分五个部分。第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。本书写作风格深入浅出,实例丰富,引人入胜。本书可作为高等学校自然语言处理或计算语言学的本科生和研究生的教材,也可以作为从事人工智能、自然语言处理等领域的研究人员和技术人员的必备参考。
Computational Simulation in Evolutionary Linguistics 豆瓣
作者: Tao GONG (龔濤) 出版社: Taiwan: Academia Sinica 2009
本專著通過一個自行開發的多個體計算仿真模型來探索語言衍生中的一個關鍵問題,即語法能力是如何產生的。它是由天生的、人類所特有的能力決定的,還是從一些人與動物普遍具有的簡單能力中逐步適應發展而來的?該模型模擬了兩種語言普適特性(體現於詞彙上的合成性和體現於詞序上的規則性)的衍生過程,指出從整體語言向合成語言的轉化是一個詞彙與基本成分詞序共同演化的過程。該模型同時記錄了一個“自底向頂”的語法發展過程,即句子層面的(頂層的)詞序可通過複用詞項間的(底層的)局部詞序來得到。這些仿真結果表明語言的合成性和規則性,以及相關的語言能力可以從一些人與動物普遍具有的能力(如簡單的特徵提取和排序能力)中發展而來。
除了語言使用者的學習機制,本論文進一步討論了社群傳播,社會和語義結構對語言演化所施加的影響。首先,通過仿真幾種主要的社群傳播形式,本論文探討了“水平”傳播中的約定俗成效應對語言演化所起的作用。其次,通過記錄語言在幾種簡單社會結構中的產生與保持,本論文探討了受歡迎個體在語言演化中的作用,個體間對語言的理解與整個社會層次結構間的相互關係,以及社群間的交流對社群間語言趨同所起的作用。最後,通過模擬在不同語義結構下的語言保持,本論文指出不同的語義結構會對詞序產生影響,此因素可被用於解釋人類語言在基本詞序上的偏向性分佈。這些研究討論了自組織在語言演化中所起的作用,重新認識了社群傳播中的樽頸效應,並對其他研究社會結構對語言演化之影響的課題起了指導性作用。
语音与语言处理 豆瓣
Speech and Language Processing
作者: Daniel Jurafsky / James H. Martin 出版社: 人民邮电出版社 2010
本书是第一本从各个层面全面介绍语言技术的书,自第1版出版以来,一直好评如潮,被国外许多著名大学选为自然语言处理和计算语言学课程的主要教材。本书将深入的语言分析与健壮的统计方法结合起来,新版更是涉及了大量的现代技术,将自然语言处理、计算语言学以及语音识别等内容融合在一本书中,把各种技术相互联系起来,让读者了解怎样才能最佳地利用每种技术,怎样才能将各种技术结合起来使用。本书写作风格引人入胜,深入技术细节而又不让人感觉枯燥。
本书不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,对于自然语言处理相关领域的研究人员和技术人员也是不可或缺的权威参考书。
基于认知的汉语计算语言学研究 豆瓣
作者: 袁毓林 出版社: 北京大学出版社 2008
陆序
冯序
一、计算理论和语言研究
计算语言学的理论方法和研究取向
基于统计的语言处理模型的有用性和局限性
认知科学和汉语计算语言学
面向当代科技的语言研究的理论和方法
二、论元结构和描述框架
论元角色的层级关系和语义特征
一套汉语动词的论元角色的语法指标
汉语谓词的论元结构的描述框架
论元结构和句式结构互动的动因、机制和条件——表达精细化对动词配价和句式构造的影响
三、信息抽取和语义标注
信息抽取的语义知识资源研究
用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法
用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用
基于论元结构的语义标注的体系和规范
新闻语体真实文本的语义标注的实践
四、专题研究和个案分析
容器隐喻和套件隐喻及相关的语法现象——词语同现限制的认知解释和计算分析
关于分词规范和规范词表的若干意见
中文信息处理中的语言难题问答
缓冲式移动通信及其发展方向 ——一个语言学家的设计思想
走向多层面互动的汉语研究
五、附录
赵元任先生评传
朱德熙先生评传
后记
乔治·莱考夫认知语言学十讲 豆瓣
作者: [美] 乔治·莱考夫 出版社: 外语教学与研究出版社 2007 - 4
《乔治·莱考夫认知语言学十讲》概括了作者对语言学某一领域的研究成果;同时讲座的形式使深奥的内容变得深入浅出,易于理解。北京航空航天大学外语系和外国语言研究所于2004年4月邀请了认知语言学创始George Lakoff教授来北京作了系列讲座。讲座先后在北京航空航天大学、北京大学、清华大学、北京师范大学和北京外国语大学进行。Lakoff教授通过十次讲座系统讲授了认知语言学的核心内容以及它的历史发展、与其他学科的交叉、最新动态及未来趋势等。讲座基本涵盖了Lakoff教授41年来的主要学术观点和研究成果。本系列讲座成书名为《乔治·莱考夫认知语言学十讲》,是“世界著名语言学家系列讲座”丛书中的一本。
The Handbook of Computational Linguistics and Natural Language Processing (Blackwell Handbooks in Linguistics) 豆瓣
作者: Clark, Alexander; Fox, Chris; Lappin, Shalom 出版社: Wiley-Blackwell 2010 - 8
This comprehensive reference work provides an overview of the concepts, methodologies, and applications in computational linguistics and natural language processing (NLP). Features contributions by the top researchers in the field, reflecting the work that is driving the discipline forward Includes an introduction to the major theoretical issues in these fields, as well as the central engineering applications that the work has produced Presents the major developments in an accessible way, explaining the close connection between scientific understanding of the computational properties of natural language and the creation of effective language technologies Serves as an invaluable state-of-the-art reference source for computational linguists and software engineers developing NLP applications in industrial research and development labs of software companies
俄罗斯计算语言学与机器翻译 豆瓣
2009 - 8
《俄罗斯计算语言学与机器翻译》全面阐释了俄罗斯在计算语言学和以机器翻译为代表的信息处理系统研发领域取得的科研成就,以及某些具体语言处理目标的实现策略和技术,这也是本书区别于其他计算语言学著作的一个鲜明特色。
Foundations of Computational Linguistics 豆瓣
作者: Hausser, Roland R. 出版社: Springer Verlag
The central task of a future-oriented computational linguistics is the development of cognitive machines which humans can freely talk with in their respective natural language. In the long run, this task will ensure the development of a functional theory of language, an objective method of verification,and a wide range of practical applications.
Natural communication requires not only verbal processing, but also non-verbal perception and action. Therefore the content of this textbook is organized as a theory of language for the construction of talking robots. The main topic is the mechanism of natural language communication in both the speaker and the hearer. The book contains more than 700 exercises for reviewing key ideas and important problems.
依存语法的理论与实践 豆瓣
作者: 刘海涛 出版社: 科学出版社 1991
《依存语法的理论与实践》的主要目的是,在充分了解前人有关依存关系、配价理论、依存形式化和依存句法分析方法的基础上,归纳出依存语法和配价理论的一般原理和方法,提出一套较完整的基于配价模式的依存语法分析框架,并用实验来证明这一框架的可行性。与此同时,我们也力图用《依存语法的理论与实践》提出的理论架构作为主线,将相关领域的主要研究成果串在一起,形成一部配价理论和依存语法研究的简史。
为了让国内读者更好地了解依存语法的一些基本思想和方法,《依存语法的理论与实践》在介绍其他学者的观点时,尽可能采用“引”而非“述”的方式,目的是为了更好地表现原义,减少误读率。在写作过程中,我们尽可能采用第一手的文献,所引外文资料一般均由作者自译。在计算语言学方法方面,《依存语法的理论与实践》对基于规则的方法和基于统计的方法都给予了足够的重视。理论求高、应用求实,是《依存语法的理论与实践》的基本方针。
2017年2月24日 已读
一本300多页的书内容那么丰富,横向纵向都有了。把配价和深度学习放一块,不知道会不会有好的效率。刘先生自己做的汉语的树库毕竟小,实践起来得更大的树库。不过现在机器翻译好像确实都基于统计,语言学家要加油实践和投入市场啊。
NLP 依存语法 句法分析 数理语言学 自然语言处理
语言与语言学百科全书 豆瓣
作者: Keith Brown 出版社: 上海外语教育出版社 2008 - 5
《语言与语言学百科全书》(第2版)由外教社从Elsevier出版社引进出版, 是迄今世界最大的一套语言学百科全书,堪称语言学知识词典的巨制鸿篇。与问世于1993年的《语言与语言学百科全书》(第1版)相比,第2版拓展了语用学、语义学、句法学、词法学、语音学、音系学等范畴,使其内容更丰富、题材更新颖、收录更完备。全书共14卷,收录大词目3000多条,每条词目均有丰富的内容和详尽的解释,除按字母顺序编排外,还有主题分类、交叉检索和主题索引。
英国爱丁堡大学马克·斯迪蒙教授概括说:“该书的编辑和作者群英荟萃。项目范畴之广、规模之大,可谓开创历史之先河。”
★ 三大优势:学术权威性最高、文章内容最新、覆盖面最广
★ 四大亮点:全新作者撰稿、全新编辑审校、探索全新题材、收录全新文章
★ 纵贯三大分科:理论语言学、应用语言学、语言学边缘学科
★ 横盖六大领域:语言体系研究、言语活动研究、言语机制研究、话语研究、计算语言学研究、文字体系研究
牛津计算语言学手册 豆瓣
作者: 米特科夫 编 出版社: 外语教学与研究出版社 1991
《牛津计算语言学手册》内容简介:《牛津计算语言学手册》是一部手册性的计算语言学专著,收录了包括语言学家、计算机专家和语言工程人员在内的50位学者撰写的综述性文章,全面地反映了国外计算语言学主要领域的最新成果,是我们了解国外计算语言学发展动向的一个窗口。 全书各章写作风格一致,内容协调,浑然一体,使用有趣的实例来介绍艰深的技术问题,而且尽量不使用繁难的数学公式,尤其适合文科背景的读者阅读。对于那些对计算语言学感兴趣和刚入门的读者而言,《牛津计算语言学手册》也是一本必备的参考书。
统计自然语言处理基础 豆瓣 Goodreads
Foundations of Statistical Natural Language Processing
作者: Chris Manning / Hinrich Schütze 译者: 苑春法 / 李伟 出版社: 电子工业出版社 2005 - 1
《统计自然语言处理基础:国外计算机科学教材系列》是一本全面系统地介绍统计自然语言处理技术的专著,被国内外许多所著名大学选为计算语言学相关课程的教材。《统计自然语言处理基础:国外计算机科学教材系列》涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件工具将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析,适合不同水平的读者群的需求。同时,《统计自然语言处理基础:国外计算机科学教材系列》将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。在《统计自然语言处理基础:国外计算机科学教材系列》的配套网站上提供了许多相关资源和工具,便于读者结合书中习题,在实践中获得提高。近年来,自然语言处理中的统计学方法已经逐渐成为主流。