NeoDB - ArendelleOlaf - 标签

Analyzing Linguistic Data 豆瓣

作者: R. H. Baayen 出版社: 劍橋大學出版社 2008 - 3

Statistical analysis is a useful skill for linguists and psycholinguists, allowing them to understand the quantitative structure of their data. This textbook provides a straightforward introduction to the statistical analysis of language. Designed for linguists with a non-mathematical background, it clearly introduces the basic principles and methods of statistical analysis, using 'R', the leading computational statistics programme. The reader is guided step-by-step through a range of real data sets, allowing them to analyse acoustic data, construct grammatical trees for a variety of languages, quantify register variation in corpus linguistics, and measure experimental data using state-of-the-art models. The visualization of data plays a key role, both in the initial stages of data exploration and later on when the reader is encouraged to criticize various models. Containing over 40 exercises with model answers, this book will be welcomed by all linguists wishing to learn more about working with and presenting quantitative data.

R语言入门与实践豆瓣

Hands-On Programming with R

作者: [美] Garrett Grolemund 译者: 冯凌秉出版社: 人民邮电出版社 2016 - 6

本书精心策划了三个虚拟项目，将数据科学家必需的专业技能融合其中，教会读者如何将数据存储到计算机内存中，如何在必要的时候转换内存中的数据值，如何用R编写自己的程序并将其用于数据分析和模拟运行。读者将跟随世界一流的RStudio培训师掌握宝贵的编程技能，并借助这些技能成为优秀的数据科学家。

R数据科学豆瓣

R for Data Science: Visualize, Model, Transform, Tidy, and Import Data

10.0 (5 个评分) 作者: [新西兰] 哈德利 • 威克姆 / [美] 加勒特 • 格罗勒芒德译者: 陈光欣出版社: 人民邮电出版社 2018 - 7

本书的目标是教会读者使用最重要的数据科学工具，从而为实施数据科学奠定坚实的基础。读完本书后，你将掌握R语言的精华，并能够熟练使用多种工具来解决各种数据科学难题。每一章都按照这样的顺序组织内容：先给出一些引人入胜的示例，以便你可以整体了解这一章的内容，然后再深入细节。本书的每一节都配有习题，以帮助你实践所学到的知识。

ggplot2: Elegant Graphics for Data Analysis (Use R!) 豆瓣

作者: Hadley Wickham 出版社: Springer 2016 - 6

This new edition to the classic book by ggplot2 creator Hadley Wickham highlights compatibility with knitr and RStudio. ggplot2 is a data visualization package for R that helps users create data graphics, including those that are multi-layered, with ease. With ggplot2, it's easy to:
produce handsome, publication-quality plots with automatic legends created from the plot specification
superimpose multiple layers (points, lines, maps, tiles, box plots) from different data sources with automatically adjusted common scales
add customizable smoothers that use powerful modeling capabilities of R, such as loess, linear models, generalized additive models, and robust regression
save any ggplot2 plot (or part thereof) for later modification or reuse
create custom themes that capture in-house or journal style requirements and that can easily be applied to multiple plots
approach a graph from a visual perspective, thinking about how each component of the data is represented on the final plot
This book will be useful to everyone who has struggled with displaying data in an informative and attractive way. Some basic knowledge of R is necessary (e.g., importing data into R). ggplot2 is a mini-language specifically tailored for producing graphics, and you'll learn everything you need in the book. After reading this book you'll be able to produce graphics customized precisely for your problems, and you'll find it easy to get graphics out of your head and on to the screen or page.

ggplot2：数据分析与图形艺术豆瓣

Ggplot2. elegant graphics for data analysis

作者: 哈德利·威克姆 (Hadley Wickham) 译者: 统计之都出版社: 西安交通大学出版社 2013 - 5

中译本序
每当我们看到一个新的软件，第一反应会是：为什么又要发明一个新软件？ggplot2是R世界里相对还比较年轻的一个包，在它之前，官方R已经有自己的基础图形系统（graphics包）和网格图形系统（grid包），并且Deepayan Sarkar也开发了lattice包，看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问，为什么还要发明一套新的系统？
设计理念
打个比方，想想我们小时候怎样学中文的。最开始的时候我们要识字，不认识字就没法阅读和写作，但我们并不是一直按照一个个汉字学习的，而是通过句子和具体的场景故事学习的。为什么不在小学时背六年字典呢？那样可能认识所有的汉字。原因很简单，光有单字，我们不会说话，也无法阅读和写作。缺的是什么？答案是对文字的组织能力，或者说语法。
R的基础图形系统基本上是一个“纸笔模型”，即：一块画布摆在面前，你可以在这里画几个点，在那里画几条线，指哪儿画哪儿。后来lattice包的出现稍微改善了这种情况，你可以说，我要画散点图或直方图，并且按照某个分类变量给图中的元素上色，此时数据才在画图中扮演了一定的中心角色，我们不用去想具体这个点要用什么颜色（颜色会根据变量自动生成）。然而，lattice继承了R语言的一个糟糕特征，就是参数设置铺天盖地，足以让人窒息，光是一份xyplot()函数的帮助文档，恐怕就够我们消磨一天时间了，更重要的是，lattice仍然面向特定的统计图形，像基础图形系统一样，有直方图、箱线图、条形图等等，它没有一套可以让数据分析者说话的语法。
那么数据分析者是怎样说话的呢？他们从来不会说这条线用#FE09BE颜色，那个点用三角形状，他们只会说，把图中的线用数据中的职业类型变量上色，或图中点的形状对应性别变量。有时候他们画了一幅散点图，但马上他们发现这幅图太拥挤，最好是能具体看一下里面不同收入阶层的特征，所以他们会说，把这幅图拆成七幅小图，每幅图对应一个收入阶层。然后发现散点图的趋势不明显，最好加上回归直线，看看回归模型反映的趋势是什么，或者发现图中离群点太多，最好做一下对数变换，减少大数值对图形的主导性。
从始至终，数据分析者都在数据层面上思考问题，而不是拿着水彩笔和调色板在那里一笔一划作图，而计算机程序员则倾向于画点画线。Leland Wilkinson的著作在理论上改善了这种状况，他提出了一套图形语法，让我们在考虑如何构建一幅图形的时候不再陷在具体的图形元素里面，而是把图形拆分为一些互相独立并且可以自由组合的成分。这套语法提出来之后他自己也做了一套软件，但显然这套软件没有被广泛采用；幸运的是，Hadley Wickham在R语言中把这套想法巧妙地实现了。
为了说明这种语法的想法，我们考虑图形中的一个成分：坐标系。常见的坐标系有两种：笛卡尔坐标系和极坐标系。在语法中，它们属于一个成分，可自由拆卸替换。笛卡尔坐标系下的条形图实际上可以对应极坐标系下的饼图，因为条形图的高可以对应饼图的角度，本质上没什么区别。因此在ggplot2中，从一幅条形图过渡到饼图，只需要加极少量的代码，把坐标系换一下就可以了。如果我们用纸笔模型，则可以想象，这完全是不同的两幅图，一幅图里面要画的是矩形，另一幅图要画扇形。
更多的细节在本书中会介绍，这里我们只是简略说明用语法画图对用纸笔画图来说在思维上的优越性；前者是说话，后者是说字。
发展历程
ggplot2是Hadley在爱荷华州立大学博士期间的作品，也是他博士论文的主题之一，实际上ggplot2还有个前身ggplot，但后来废弃了，某种程度上这也是Hadley写软件的特征，熟悉他的人就知道这不是他第一个“2”版本的包了（还有reshape2）。带2的包和原来的包在语法上会有很大的改动，基本上不兼容。尽管如此，他的R代码风格在R社区可谓独树一帜，尤其是他的代码结构很好，可读性很高，ggplot2是R代码抽象的一个杰作。读者若感兴趣，可以在GitHub网站上浏览他的包：https://github.com/hadley。在用法方面，ggplot2也开创了一种奇特而绝妙的语法，那就是加号：一幅图形从背后的设计来说，是若干图形语法的叠加，从外在的代码来看，也是若干R对象的相加。这一点精妙尽管只是ggplot2系统的很小一部分，但我个人认为没有任何程序语言可比拟，它对作为泛型函数的加号的扩展只能用两个字形容：绝了。
至2013年2月26日，ggplot2的邮件列表（http://groups.google.com/group/ggplot2 ）订阅成员已达3394人，邮件总数为15185封，已经成为一个丰富、活跃的用户社区。未来ggplot2的发展也将越来越依赖于用户的贡献，这也是很多开源软件最终的走向。
关于版本更新
原书面世之时，ggplot2的版本号是0.8.3，译者开始翻译此书时是0.9.0版本；该版本较之0.8.3，内部做了一些大改动。此后，ggplot2频繁升级，目前版本号是0.9.3，当然这也给本书的翻译过程带来了相当大的麻烦。因为译者不但要修正原书中大量过时的代码、重新画图，还要修正过时的理念，以及处理数次版本更新的影响。所幸，在翻译过程中，译者得到了本书审校殷腾飞博士、ggplot2开发者Hadley Wickham和Wistong Chang的大力帮助。
如果你是老用户，那么可能需要阅读下面的小节。之后ggplot2有过多次更新，尤其是0.9.0之后，ggplot2的绘图速度和帮助文档有了质的飞跃。关于0.9的更新，读者可以从https://github.com/downloads/hadley/ggplot2/guide-col.pdf下载一份细致的说明文档，但原文档比较长，而且有些内部更新问题我们也不一定需要了解，因此这里给一段概述。
ggplot2的帮助文档大大扩充了，过去头疼的问题之一就是一个函数里面不知道有哪些可能的参数，例如theme()函数，现在已经有了详细说明。
新增图例向导函数guide_legend()和guide_colorbar()，前者可以用来指导图例的排版，例如可以安排图例中元素排为n行m列；后者增强了连续变量图例的展示，例如当我们把颜色映射到一个连续变量上时，过去生成的图例是离散的，现在可以用这个函数生成连续颜色的图例（渐变色）。
新增几何对象函数geom_map()（让地图语法变得更简单），geom_raster()（更高效的geom_tile()），geom_dotplot()（一维点图，展示变量密度分布）和geom_violin()（小提琴，实为密度曲线）。
新增统计变换函数stat_summary2d()（在二维网格上计算数据密度），stat_summary_hex()（在六边形“蜂巢”上计算数据密度），stat_bindot()（一维点图密度），stat_ydensity()（密度曲线，用于小提琴图）。
facet_grid()支持X轴和Y轴其中一者可以有自由的刻度（根据数据范围而定），以往要么所有切片使用同样的坐标轴刻度，要么所有都自由。
geom_boxplot()开始支持画箱线图的凹槽（notch），就像R基础图形系统中的boxplot()函数。
新增函数ggmissing()用来展示缺失值的分布，ggorder()按照数据观察顺序先后画折线图，ggstructure()展示数据热图。
另外这次更新涉及到一些函数参数名称的变化，如果旧代码在这个版本中报错说有未使用的参数，那么用户需要再次查看帮助文档，确保输入的参数在函数中存在。在所有这些表面的更新背后，实际上ggplot2很大程度上被重写了，例如开始使用R自带的S3泛型函数设计，以及将过去ggplot2的功能继续模块化为一些独立的包，一个典型的例子就是标度部分的功能被抽象到scales包中，从数据映射到颜色、大小等外观属性可以由这个包直接完成。这种分拆也使得其他开发者可使用过去ggplot2内部的一些功能函数。
0.9.1版本主要解决了0.9.0版本中的一些漏洞。ggplot2在2012年9月4日发布了新的版本0.9.2，其中一些特性和更新有必要提及：
采用了全新的主题（theme）系统，opts()函数已被标记为“不推荐使用”（deprecated），将在未来版本中被取消，取而代之的是theme()函数，主题元素（theme element）由属性列表构成，支持继承，主题之间可以直接进行合并等操作。详情参见wiki页面：https://github.com/wch/ggplot2/wiki/New-theme-system 。
依赖于新的gtable包。用来更方便地调整修改ggplot2图形中的图元，ggplotGrob()会返回一个gtable类，这个对象可以利用gtable包中提供的函数和接口进行操作。
所有“模板”类型的图形函数，比如plotmatrix()，ggorder()等等，已被标记为“不推荐使用”（deprecated），将在未来版本中取消。
在本书出版之际，ggplot2更新到了版本0.9.3，修复了0.9.2的一些漏洞，其主要更新包括
不再支持plotmatrix()函数。
geom_polygon()提速，比如世界地图的绘制快了12倍左右。
新增部分主题，比如theme_minimal()，theme_classic()。
本书的所有代码和图片都是针对新版本0.9.3的，在内容方面也根据版本更新对原文做了适当的增删填补，以满足读者的需求。
本书把影响正文阅读的彩图集中放在附录后面，读者可以随时翻阅。
致谢
在听说我们翻译完这本书之后，本书原著Hadley很高兴，给我们发邮件说：
I am excited and honoured to have my book translated to Chinese. ggplot2 has become far more popular than I ever imagined, and I'm excited that this translation will allow many more people to learn ggplot2. I'm very grateful that Yihui and his team of translators (Nan Xiao, Tao Gao, Yixuan Qiu, Weicheng Zhu, Taiyun Wei and Lanfeng Pan) made this possible.
One of the biggest improvements to ggplot2 since the book was first written is the ggplot2 mailing list. This is a very friendly environment where you can get help with your visualisations, and improve your own knowledge of ggplot2 by helping others solve their problems. I'd strongly encourage you to join the mailing list, even if you think your English is not very good -- we are very friendly people.
我们感谢这本书的译者，包括邱怡轩（第1~2章）、主伟呈（第3~4章）、肖楠（第5~6章）、高涛（第7~8章）、潘岚锋（第9章）、魏太云（第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作）。所有译者均来自于统计之都（http://cos.name ）。
爱荷华州立大学的殷腾飞博士、中国人民大学统计学院的孟生旺教授、浙江大学的张政同学通读了译稿，提出了很多有用的建议，殷腾飞博士还提供了大多数新版本中的解决方案，并担任本书的审校。肖凯老师和余光创博士分别对第1~4章、第8~10章以及附录提出了很多修改意见，此外，中国人民大学的陈妍、李晓矛、谢漫锜三位同学、中国再保险公司的李皞先生、百度公司的韩帅先生、eBay公司的陈丽云女士、Mango Solutions公司的李舰先生、京东商城的刘思喆先生、首钢总公司的邓一硕先生、新华社的陈堰平先生在此书的翻译过程中也曾提过不少宝贵的建议，在此一并表示感谢。
为了更好地服务社区，我们还建立了翻译主页：https://github.com/cosname/ggplot2-translation ，读者可以在这里得到最新的勘误和书中的代码，也可以随时提出任何问题。
谢益辉
2013年2月26日

Numerical Ecology with R 豆瓣

作者: Daniel Borcard / Francois Gillet … 出版社: Springer 2011 - 1

面向生态学数据的贝叶斯统计豆瓣

作者: 克拉克出版社: 科学出版社 2013 - 3

《面向生态学数据的贝叶斯统计:层次模型、算法和R编程》内容简介：作为统计学的两大分支，频率论和贝叶斯统计创立的时间相差无几，但贝叶斯统计直到近10年才被逐步引进到生态学数据分析。《面向生态学数据的贝叶斯统计：层次模型、算法和R编程》涵盖方法引论与实验分析应用两部分，针对多个时空尺度，介绍了适合于生态学数据的统计推断方法和层次模型，涉及经典频率论和贝叶斯统计的模型、算法和具体编程。首先阐述了生态学数据的层次结构和时空变异性，以及频率论和贝叶斯统计。然后介绍贝叶斯推断的基础概念、分析框架和算法原理；并进一步针对生态学层次模型、时间序列及时空复合格局数据依次展开分析模拟。在应用操作部分，配合方法部分的各章内容介绍基于R的算法与编程实践。最后《面向生态学数据的贝叶斯统计：层次模型、算法和R编程》还附录了与生态学数据密切相关的频率论与贝叶斯统计的基础知识。
《面向生态学数据的贝叶斯统计：层次模型、算法和R编程》适用于生态学和环境科学专业的研究生和科研人员，可作为实验和观测数据分析的教材或参考书。具有一定概率论和贝叶斯统计基础及统计软件R应用编程技术的人员，对于理解和应用《面向生态学数据的贝叶斯统计：层次模型、算法和R编程》所涉及的相关方法是必要的。

空间分析豆瓣

作者: 福廷 (Marie-Josee Fortin) / 戴尔 (Mark Dale) 译者: 晓晖 / 时忠杰 … 出版社: 高等教育出版社 2014 - 9

对国内的大多数从事生态研究的学者和研究生而言，数学方法的选择是他们在研究中所面临的最大的难题之一，因此在实验设计阶段因没有充分考虑不同方法对数据的要求，导致最后的试验结果无法做较为深入的分析，这也是国内生态学者的研究成果在国外期刊发表比较难以发表的主要原因之一。本书以目前生态学研究中最为重要的空间分析为主题，系统地介绍了目前生态学中常用的数学方法，因为作者是生态学家而非数学家，因此从生态学的角度对这些数学方法的介绍更容易被生态学家所理解和接受。本书是迄今为止并不多见的对生态学中常用的空间分析方法进行系统、全面、深入浅出介绍的专著，正如本书的名字所示，本书完全可以作为一本生态学家的指南。无疑本书的翻译出版将有利于推进空间分析方法在生态学中更为科学、有效地应用。

Applied Predictive Modeling 豆瓣 Goodreads

作者: Max Kuhn / Kjell Johnson 出版社: Springer 2013 - 9

This text is intended for a broad audience as both an introduction to predictive models as well as a guide to applying them. Non-mathematical readers will appreciate the intuitive explanations of the techniques while an emphasis on problem-solving with real data across a wide variety of applications will aid practitioners who wish to extend their expertise. Readers should have knowledge of basic statistical ideas, such as correlation and linear regression analysis. While the text is biased against complex equations, a mathematical background is needed for advanced topics. Dr. Kuhn is a Director of Non-Clinical Statistics at Pfizer Global R&D in Groton Connecticut. He has been applying predictive models in the pharmaceutical and diagnostic industries for over 15 years and is the author of a number of R packages. Dr. Johnson has more than a decade of statistical consulting and predictive modeling experience in pharmaceutical research and development. He is a co-founder of Arbor Analytics, a firm specializing in predictive modeling and is a former Director of Statistics at Pfizer Global R&D. His scholarly work centers on the application and development of statistical methodology and learning algorithms.

The R Inferno 豆瓣

作者: Patrick Burns 出版社: Standard Copyright License 2012 - 2

An essential guide to the trouble spots and oddities of R. In spite of the quirks exposed here, R is the best computing environment for most data analysis tasks. R is free, open-source, and has thousands of contributed packages. It is used in such diverse fields as ecology, finance, genomics and music. If you are using spreadsheets to understand data, switch to R. You will have safer -- and ultimately, more convenient -- computations.

环境与生态统计豆瓣

作者: 钱松译者: 曾思育 2011 - 7

《环境与生态统计:R语言的应用》内容简介：在强调统计思维的归纳性本质基础上，《环境与生态统计:R语言的应用》把应用统计学跟环境与生态领域关联到一起。《环境与生态统计:R语言的应用》遵循解决统计建模问题的一般方法。内容覆盖了模型界定、参数估值和模型评估。作者用了很多实例来阐述统计学模型以及如何用R语言来实现模型。《环境与生态统计:R语言的应用》首先为开展简单的数据分析任务提供了基础知识。例如探索性数据分析和线性回归模型拟合。接下来重点介绍了统计建模，包括线性和非线性模型、分类和回归树以及广义线性模型。书中还讨论了用于模型检验的模拟，为开发出的模型提供评估工具，同时探讨了多层回归模型这类会对环境和生态学数据分析产生广泛影响的模型。
《环境与生态统计:R语言的应用》重点针对的是环境和生态学问题的统计建模和数据分析。通过引导读者理解解决科学问题和开发统计模型的过程，轻松地从科学假设过渡到统计模型。

数量生态学--R语言的应用豆瓣

作者: 博卡德 (Daniel Borcard) / 吉莱 (Franqois Gillet) … 出版社: 高等教育出版社 2014 - 5

越南战争 (2017) 豆瓣 TMDB

The Vietnam War Season 1 所属电视剧集: 越南战争

9.7 (51 个评分) 导演: 肯·伯恩斯 / 琳恩·诺维克演员: 彼德·考约特

著名纪录片导演肯·伯恩斯的越南战争纪录片，于2017年在美国PBS电视台播出，共10集，总时长有18小时，采访了来自各方的近80名亲历者，既有参战与反战的美国人，也有南越与北越的军民。本片历经十年制作，跨遍全球搜集资料，其中有许多少见和重新数字化的影像档案，还有20世纪最为出名的摄影照片和家庭影视，以及历史新闻片段和政府内部的秘密录音。
随着PBS推出纪录片《越南战争》，我们得以回顾那个分裂的年代。对于在那段时间内生活的人来说，这段时期将永远印在他们心中。约翰逊总统在南越将杰出服务十字架授予南越Cam Ranh湾第一中尉。从1962年到1971年，美国军方在越南森林上喷洒化学试剂——脱叶剂，这种落叶剂是为了将越南长得茂盛的树林，使其变得光秃秃，这样就让北越的军队失去了天然的隐蔽屏障。落叶剂对环境的危害极大。其危害表现一是因大面积植被的破坏而危及该地区整个生态系统，二是这种农药的致畸作用会使人类健康受到严重影响。

R语言实战豆瓣

R in Action

9.3 (6 个评分) 作者: 卡巴科弗译者: 高涛 / 肖楠 … 出版社: 人民邮电出版社 2013 - 1

数据时代已经到来，但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响，　相对于经验和直觉，在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言，几乎能够完成任何数据处理任务，可安装并运行于所有主流平台，为我们提供了成千上万的专业模块和实用工具，是从大数据中获取有用信息的绝佳工具。　　本书从解决实际问题入手，尽量跳脱统计学的理论阐述来讨论R语言及其应用，讲解清晰透澈，极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例，而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书，你将全面掌握使用R语言进行数据分析、数据挖掘的技巧，并领略大量探索和展示数据的图形功能，从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗？想要科学分析数据并正确决策吗？不妨从本书开始，挑战大数据，用R开始炫酷的数据统计与分析吧！　　本书内容：　　R安装与操作
数据导入/导出及格式化双变量关系的描述性分析回归分析
模型适用性的评价方法以及结果的可视化
用图形实现变量关系的可视化
在给定置信度的前提下确定样本量
高级统计分析方法和高级绘图

An Introduction to Statistical Learning 豆瓣 Goodreads

9.8 (12 个评分) 作者: Gareth James / Daniela Witten … 出版社: Springer 2013 - 8

An Introduction to Statistical Learning provides an accessible overview of the field of statistical learning, an essential toolset for making sense of the vast and complex data sets that have emerged in fields ranging from biology to finance to marketing to astrophysics in the past twenty years. This book presents some of the most important modeling and prediction techniques, along with relevant applications. Topics include linear regression, classification, resampling methods, shrinkage approaches, tree-based methods, support vector machines, clustering, and more. Color graphics and real-world examples are used to illustrate the methods presented. Since the goal of this textbook is to facilitate the use of these statistical learning techniques by practitioners in science, industry, and other fields, each chapter contains a tutorial on implementing the analyses and methods presented in R, an extremely popular open source statistical software platform. Two of the authors co-wrote The Elements of Statistical Learning (Hastie, Tibshirani and Friedman, 2nd edition 2009), a popular reference book for statistics and machine learning researchers. An Introduction to Statistical Learning covers many of the same topics, but at a level accessible to a much broader audience. This book is targeted at statisticians and non-statisticians alike who wish to use cutting-edge statistical learning techniques to analyze their data. The text assumes only a previous course in linear regression and no knowledge of matrix algebra.

机器学习与R语言豆瓣

作者: Brett Lantz 出版社: 机械工业出版社 2015 - 4

随着大数据的概念变得越来越流行，对数据的探索、分析和预测成为大数据分析领域的基本技能之一。作为探索和分析数据的基本理论和工具，机器学习和数据挖掘成为时下炙手可热的技术。R作为功能强大并且免费的数据分析工具，在数据分析领域获得了越来越多用户的青睐。
本书通过丰富的实际案例来探索如何应用R来进行现实世界问题的机器学习，如何从数据中获取可以付诸行动的洞察力。本书案例清晰而实用，讲解循序渐进，是一本用R进行机器学习的实用指南，既适用于机器学习的初学者，也适用于具有一定经验的老手，本书将帮助他们回答有关R的所有问题。

复杂数据统计方法豆瓣

作者: 吴喜之出版社: 中国人民大学出版社 2012 - 10

《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据，包括横截面数据、纵向数据和时间序列数据，通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点：(1)以数据为导向；(2)介绍最新的方法(附有传统方法回顾)；(3)提供r软件入门及全部例子计算的日代码及数据的网址；(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生，各领域的教师和实际工作者。

香肠派对 (2016) 豆瓣 维基数据 IMDb TMDB

Sausage Party

6.9 (413 个评分) 导演: 康拉德·弗农 / 格雷格·蒂曼演员: 塞斯·罗根 / 克里斯汀·韦格 …

其它标题: Sausage Party / 洋肠派对(港) …

故事发生在一间大超市之中，在陈列在此的商品间，流传着一个古老的传说，某一日，那位名为“顾客”的上帝会现身此处，把你带回家，从此你将登上人生的巅峰，享受无上的荣光。香肠弗兰克（塞斯·罗根 Seth Rogen 配音）和他的女友热狗面包布兰达（克里斯汀·韦格 Kristen Wiig 配音）最大的愿望，就是能被同一位顾客买回家，这样方可以过上向往已久的“合体”生活。
然而，一瓶曾经被顾客买走之后又被退回超市的蜂蜜芥末（丹尼·麦克布耐德 Danny McBride 配音）却道出了事件的真相，那就是，根本不存在什么上帝，也并没有天堂，等待着它们的，有的只有残忍的生吞活剥，骨肉分离。为了验证蜂蜜芥末的话，弗兰克找到了神秘的龙舌兰酒（比尔·哈德尔 Bill Hader 配音），与此同时，因为意外而跌落货架滚至别处的布兰达亦和同样遭遇的贝果萨米（爱德华·诺顿 Edward Norton 配音）、亚美尼亚薄饼拉瓦西（大卫·克鲁霍尔特兹 David Krumholtz 配音）一起，寻找回家的路。

Statistics for Linguistics with R 豆瓣

作者: Stefan Th. Gries 出版社: De Gruyter Mouton 2010 - 5

R

越南战争 (2017) 豆瓣 TMDB

香肠派对 (2016) 豆瓣 维基数据 IMDb TMDB

香肠派对 (2016) 豆瓣维基数据 IMDb TMDB