数据挖掘
Python编程快速上手 豆瓣
Automate the Boring Stuff with Python: Practical Programming for Total Beginners
8.9 (9 个评分) 作者: Al Sweigart 译者: 王海鹏 出版社: 人民邮电出版社 2016 - 7
如今,人们面临的大多数任务都可以通过编写计算机软件来完成。Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。通过Python编程,我们能够解决现实生活中的很多任务。
本书是一本面向实践的Python编程实用指南。本书的目的,不仅是介绍Python语言的基础知识,而且还通过项目实践教会读者如何应用这些知识和技能。本书的首部分介绍了基本Python编程概念,第二部分介绍了一些不同的任务,通过编写Python程序,可以让计算机自动完成它们。第二部分的每一章都有一些项目程序,供读者学习。每章的末尾还提供了一些习题和深入的实践项目,帮助读者巩固所学的知识。附录部分提供了所有习题的解答。
本书适合任何想要通过Python学习编程的读者,尤其适合缺乏编程基础的初学者。通过阅读本书,读者将能利用强大的编程语言和工具,并且会体会到Python编程的快乐。
Speech and Language Processing, 2nd Edition 豆瓣 Goodreads
10.0 (5 个评分) 作者: Daniel Jurafsky / James H. Martin 出版社: Prentice Hall 2008 - 5
This is the 2nd edition of "Speech and Language Processing, 2000" (http://www.douban.com/subject/1810715/).
An explosion of Web-based language techniques, merging of distinct fields, availability of phone-based dialogue systems, and much more make this an exciting time in speech and language processing. The first of its kind to thoroughly cover language technology – at all levels and with all modern technologies – this book takes an empirical approach to the subject, based on applying statistical and other machine-learning algorithms to large corporations. Builds each chapter around one or more worked examples demonstrating the main idea of the chapter, usingthe examples to illustrate the relative strengths and weaknesses of various approaches. Adds coverage of statistical sequence labeling, information extraction, question answering and summarization, advanced topics in speech recognition, speech synthesis. Revises coverage of language modeling, formal grammars, statistical parsing, machine translation, and dialog processing. A useful reference for professionals in any of the areas of speech and language processing.
ggplot2:数据分析与图形艺术 豆瓣
Ggplot2. elegant graphics for data analysis
作者: 哈德利·威克姆 (Hadley Wickham) 译者: 统计之都 出版社: 西安交通大学出版社 2013 - 5
中译本序
每当我们看到一个新的软件,第一反应会是:为什么又要发明一个新软件?ggplot2是R世界里相对还比较年轻的一个包,在它之前,官方R已经有自己的基础图形系统(graphics包)和网格图形系统(grid包),并且Deepayan Sarkar也开发了lattice包,看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问,为什么还要发明一套新的系统?
设计理念
打个比方,想想我们小时候怎样学中文的。最开始的时候我们要识字,不认识字就没法阅读和写作,但我们并不是一直按照一个个汉字学习的,而是通过句子和具体的场景故事学习的。为什么不在小学时背六年字典呢?那样可能认识所有的汉字。原因很简单,光有单字,我们不会说话,也无法阅读和写作。缺的是什么?答案是对文字的组织能力,或者说语法。
R的基础图形系统基本上是一个“纸笔模型”,即:一块画布摆在面前,你可以在这里画几个点,在那里画几条线,指哪儿画哪儿。后来lattice包的出现稍微改善了这种情况,你可以说,我要画散点图或直方图,并且按照某个分类变量给图中的元素上色,此时数据才在画图中扮演了一定的中心角色,我们不用去想具体这个点要用什么颜色(颜色会根据变量自动生成)。然而,lattice继承了R语言的一个糟糕特征,就是参数设置铺天盖地,足以让人窒息,光是一份xyplot()函数的帮助文档,恐怕就够我们消磨一天时间了,更重要的是,lattice仍然面向特定的统计图形,像基础图形系统一样,有直方图、箱线图、条形图等等,它没有一套可以让数据分析者说话的语法。
那么数据分析者是怎样说话的呢?他们从来不会说这条线用#FE09BE颜色,那个点用三角形状,他们只会说,把图中的线用数据中的职业类型变量上色,或图中点的形状对应性别变量。有时候他们画了一幅散点图,但马上他们发现这幅图太拥挤,最好是能具体看一下里面不同收入阶层的特征,所以他们会说,把这幅图拆成七幅小图,每幅图对应一个收入阶层。然后发现散点图的趋势不明显,最好加上回归直线,看看回归模型反映的趋势是什么,或者发现图中离群点太多,最好做一下对数变换,减少大数值对图形的主导性。
从始至终,数据分析者都在数据层面上思考问题,而不是拿着水彩笔和调色板在那里一笔一划作图,而计算机程序员则倾向于画点画线。Leland Wilkinson的著作在理论上改善了这种状况,他提出了一套图形语法,让我们在考虑如何构建一幅图形的时候不再陷在具体的图形元素里面,而是把图形拆分为一些互相独立并且可以自由组合的成分。这套语法提出来之后他自己也做了一套软件,但显然这套软件没有被广泛采用;幸运的是,Hadley Wickham在R语言中把这套想法巧妙地实现了。
为了说明这种语法的想法,我们考虑图形中的一个成分:坐标系。常见的坐标系有两种:笛卡尔坐标系和极坐标系。在语法中,它们属于一个成分,可自由拆卸替换。笛卡尔坐标系下的条形图实际上可以对应极坐标系下的饼图,因为条形图的高可以对应饼图的角度,本质上没什么区别。因此在ggplot2中,从一幅条形图过渡到饼图,只需要加极少量的代码,把坐标系换一下就可以了。如果我们用纸笔模型,则可以想象,这完全是不同的两幅图,一幅图里面要画的是矩形,另一幅图要画扇形。
更多的细节在本书中会介绍,这里我们只是简略说明用语法画图对用纸笔画图来说在思维上的优越性;前者是说话,后者是说字。
发展历程
ggplot2是Hadley在爱荷华州立大学博士期间的作品,也是他博士论文的主题之一,实际上ggplot2还有个前身ggplot,但后来废弃了,某种程度上这也是Hadley写软件的特征,熟悉他的人就知道这不是他第一个“2”版本的包了(还有reshape2)。带2的包和原来的包在语法上会有很大的改动,基本上不兼容。尽管如此,他的R代码风格在R社区可谓独树一帜,尤其是他的代码结构很好,可读性很高,ggplot2是R代码抽象的一个杰作。读者若感兴趣,可以在GitHub网站上浏览他的包:https://github.com/hadley。在用法方面,ggplot2也开创了一种奇特而绝妙的语法,那就是加号:一幅图形从背后的设计来说,是若干图形语法的叠加,从外在的代码来看,也是若干R对象的相加。这一点精妙尽管只是ggplot2系统的很小一部分,但我个人认为没有任何程序语言可比拟,它对作为泛型函数的加号的扩展只能用两个字形容:绝了。
至2013年2月26日,ggplot2的邮件列表(http://groups.google.com/group/ggplot2 )订阅成员已达3394人,邮件总数为15185封,已经成为一个丰富、活跃的用户社区。未来ggplot2的发展也将越来越依赖于用户的贡献,这也是很多开源软件最终的走向。
关于版本更新
原书面世之时,ggplot2的版本号是0.8.3,译者开始翻译此书时是0.9.0版本;该版本较之0.8.3,内部做了一些大改动。此后,ggplot2频繁升级,目前版本号是0.9.3,当然这也给本书的翻译过程带来了相当大的麻烦。因为译者不但要修正原书中大量过时的代码、重新画图,还要修正过时的理念,以及处理数次版本更新的影响。所幸,在翻译过程中,译者得到了本书审校殷腾飞博士、ggplot2开发者Hadley Wickham和Wistong Chang的大力帮助。
如果你是老用户,那么可能需要阅读下面的小节。之后ggplot2有过多次更新,尤其是0.9.0之后,ggplot2的绘图速度和帮助文档有了质的飞跃。关于0.9的更新,读者可以从https://github.com/downloads/hadley/ggplot2/guide-col.pdf下载一份细致的说明文档,但原文档比较长,而且有些内部更新问题我们也不一定需要了解,因此这里给一段概述。
ggplot2的帮助文档大大扩充了,过去头疼的问题之一就是一个函数里面不知道有哪些可能的参数,例如theme()函数,现在已经有了详细说明。
新增图例向导函数guide_legend()和guide_colorbar(),前者可以用来指导图例的排版,例如可以安排图例中元素排为n行m列;后者增强了连续变量图例的展示,例如当我们把颜色映射到一个连续变量上时,过去生成的图例是离散的,现在可以用这个函数生成连续颜色的图例(渐变色)。
新增几何对象函数geom_map()(让地图语法变得更简单),geom_raster()(更高效的geom_tile()),geom_dotplot()(一维点图,展示变量密度分布)和geom_violin()(小提琴,实为密度曲线)。
新增统计变换函数stat_summary2d()(在二维网格上计算数据密度),stat_summary_hex()(在六边形“蜂巢”上计算数据密度),stat_bindot()(一维点图密度),stat_ydensity()(密度曲线,用于小提琴图)。
facet_grid()支持X轴和Y轴其中一者可以有自由的刻度(根据数据范围而定),以往要么所有切片使用同样的坐标轴刻度,要么所有都自由。
geom_boxplot()开始支持画箱线图的凹槽(notch),就像R基础图形系统中的boxplot()函数。
新增函数ggmissing()用来展示缺失值的分布,ggorder()按照数据观察顺序先后画折线图,ggstructure()展示数据热图。
另外这次更新涉及到一些函数参数名称的变化,如果旧代码在这个版本中报错说有未使用的参数,那么用户需要再次查看帮助文档,确保输入的参数在函数中存在。在所有这些表面的更新背后,实际上ggplot2很大程度上被重写了,例如开始使用R自带的S3泛型函数设计,以及将过去ggplot2的功能继续模块化为一些独立的包,一个典型的例子就是标度部分的功能被抽象到scales包中,从数据映射到颜色、大小等外观属性可以由这个包直接完成。这种分拆也使得其他开发者可使用过去ggplot2内部的一些功能函数。
0.9.1版本主要解决了0.9.0版本中的一些漏洞。ggplot2在2012年9月4日发布了新的版本0.9.2,其中一些特性和更新有必要提及:
采用了全新的主题(theme)系统,opts()函数已被标记为“不推荐使用”(deprecated),将在未来版本中被取消,取而代之的是theme()函数,主题元素(theme element)由属性列表构成,支持继承,主题之间可以直接进行合并等操作。详情参见wiki页面:https://github.com/wch/ggplot2/wiki/New-theme-system 。
依赖于新的gtable包。 用来更方便地调整修改ggplot2图形中的图元,ggplotGrob()会返回一个gtable类,这个对象可以利用gtable包中提供的函数和接口进行操作。
所有“模板”类型的图形函数,比如plotmatrix(),ggorder()等等,已被标记为“不推荐使用”(deprecated),将在未来版本中取消。
在本书出版之际,ggplot2更新到了版本0.9.3,修复了0.9.2的一些漏洞,其主要更新包括
不再支持plotmatrix()函数。
geom_polygon()提速,比如世界地图的绘制快了12倍左右。
新增部分主题,比如theme_minimal(),theme_classic()。
本书的所有代码和图片都是针对新版本0.9.3的,在内容方面也根据版本更新对原文做了适当的增删填补,以满足读者的需求。
本书把影响正文阅读的彩图集中放在附录后面,读者可以随时翻阅。
致谢
在听说我们翻译完这本书之后,本书原著Hadley很高兴,给我们发邮件说:
I am excited and honoured to have my book translated to Chinese. ggplot2 has become far more popular than I ever imagined, and I'm excited that this translation will allow many more people to learn ggplot2. I'm very grateful that Yihui and his team of translators (Nan Xiao, Tao Gao, Yixuan Qiu, Weicheng Zhu, Taiyun Wei and Lanfeng Pan) made this possible.
One of the biggest improvements to ggplot2 since the book was first written is the ggplot2 mailing list. This is a very friendly environment where you can get help with your visualisations, and improve your own knowledge of ggplot2 by helping others solve their problems. I'd strongly encourage you to join the mailing list, even if you think your English is not very good -- we are very friendly people.
我们感谢这本书的译者,包括邱怡轩(第1~2章)、主伟呈(第3~4章)、肖楠(第5~6章)、高涛(第7~8章)、潘岚锋(第9章)、魏太云(第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作)。所有译者均来自于统计之都(http://cos.name )。
爱荷华州立大学的殷腾飞博士、中国人民大学统计学院的孟生旺教授、浙江大学的张政同学通读了译稿,提出了很多有用的建议,殷腾飞博士还提供了大多数新版本中的解决方案,并担任本书的审校。肖凯老师和余光创博士分别对第1~4章、第8~10章以及附录提出了很多修改意见,此外,中国人民大学的陈妍、李晓矛、谢漫锜三位同学、中国再保险公司的李皞先生、百度公司的韩帅先生、eBay公司的陈丽云女士、Mango Solutions公司的李舰先生、京东商城的刘思喆先生、首钢总公司的邓一硕先生、新华社的陈堰平先生在此书的翻译过程中也曾提过不少宝贵的建议,在此一并表示感谢。
为了更好地服务社区,我们还建立了翻译主页:https://github.com/cosname/ggplot2-translation ,读者可以在这里得到最新的勘误和书中的代码,也可以随时提出任何问题。
谢益辉
2013年2月26日
线性代数的几何意义 豆瓣
作者: 任广千 / 谢聪 出版社: 西安电子科技大学出版社 2015 - 7
本书使用向量的概念对国内高校工科“线性代数”的课程内容进行了较全面的几何分析。从向量的几何意义开始,分别讲述了向量组、向量空间、行列式、矩阵、线性方程组和二次型的几何意义或几何解释,其中不乏重要概念的物理意义的解释。这本书就像一串项梁,把上百个概念和定理的几何意义串在一起敬献给读者朋友。
本书文字多为作者原创,比如叉积的物理意义,克莱姆法则、雅可比矩阵、相似/合同矩阵、转置矩阵/对偶、矩阵乘积的行列式等系列概念的几何意义等,应用方面如使用矩阵分析的方法分析电子振荡器的工作原理等。
本书图文并茂,思路清晰、语言流畅,概念及定理解释得合理、自然,同时具有通俗性、科普性,由于本书是直接根据线性代数课程的要求进行解释的,除了适合初学者和自学者使用之外,特别适合正在学习或复习线性代数的大学生作为深入思考的辅导书籍使用。
网络科学导论 豆瓣
作者: 汪小帆 / 李 翔 出版社: 高等教育出版社 2012 - 4
对各种复杂网络的定量与定性特征的科学理解已成为网络时代科学研究中一个极其重要的挑战性课题,网络科学就是一门正在兴起的面对这一挑战的交叉性学科。本书致力于系统地介绍网络科学的基本概念、思想和方法,使得具有高等数学基础的读者都能够看懂,并具备把网络科学方法用于实际网络分析的能力。为此,本书没有过多地陷入数学和物理推导,而是更为关注网络科学的思维习惯和研究方式。本书在概要介绍了网络科学的背景和研究意义之后,分为四个部分详细介绍了网络基本概念、网络拓扑性质、网络拓扑模型和网络动力学。
本书适合作为研究生和高年级本科生的网络科学教材,也可供自然科学、工程技术科学和社会科学领域的研究人员与学生参考。
凸优化 豆瓣
Convex Optimization
作者: Stephen Boyd / Lieven Vandenberghe 译者: 王书宁 / 许鋆 出版社: 清华大学出版社 2013 - 1
《信息技术和电气工程学科国际知名教材中译本系列:凸优化》内容非常丰富。理论部分由4章构成,不仅涵盖了凸优化的所有基本概念和主要结果,还详细介绍了几类基本的凸优化问题以及将特殊的优化问题表述为凸优化问题的变换方法,这些内容对灵活运用凸优化知识解决实际问题非常有用。应用部分由3章构成,分别介绍凸优化在解决逼近与拟合、统计估计和几何关系分析这三类实际问题中的应用。算法部分也由3章构成,依次介绍求解无约束凸优化模型、等式约束凸优化模型以及包含不等式约束的凸优化模型的经典数值方法,以及如何利用凸优化理论分析这些方法的收敛性质。通过阅读《信息技术和电气工程学科国际知名教材中译本系列:凸优化》,能够对凸优化理论和方法建立完整的认识。
Data Analysis 豆瓣
作者: Devinderjit Sivia / John Skilling 出版社: Oxford University Press 2006 - 7
Statistics lectures have been a source of much bewilderment and frustration for generations of students. This book attempts to remedy the situation by expounding a logical and unified approach to the whole subject of data analysis.
This text is intended as a tutorial guide for senior undergraduates and research students in science and engineering. After explaining the basic principles of Bayesian probability theory, their use is illustrated with a variety of examples ranging from elementary parameter estimation to image processing. Other topics covered include reliability analysis, multivariate optimization, least-squares and maximum likelihood, error-propagation, hypothesis testing, maximum entropy and experimental design.
The Second Edition of this successful tutorial book contains a new chapter on extensions to the ubiquitous least-squares procedure, allowing for the straightforward handling of outliers and unknown correlated noise, and a cutting-edge contribution from John Skilling on a novel numerical technique for Bayesian computation called 'nested sampling'.
概率图模型:原理与技术 豆瓣
作者: [美]Daphne Koller / [以色列]Nir Friedman 译者: 王飞跃 / 韩素青 出版社: 清华大学出版社 2015 - 3
概率图模型将概率论与图论相结合,是当前非常热门的一个机器学习研究方向。本书详细论述了有向图模型(又称贝叶斯网)和无向图模型(又称马尔可夫网)的表示、推理和学习问题,全面总结了人工智能这一前沿研究领域的最新进展。为了便于读者理解,书中包含了大量的定义、定理、证明、算法及其伪代码,穿插了大量的辅助材料,如示例(examples)、技巧专栏(skill boxes)、实例专栏(case study boxes)、概念专栏(concept boxes)等。另外,在第 2章介绍了概率论和图论的核心知识,在附录中介绍了信息论、算法复杂性、组合优化等补充材料,为学习和运用概率图模型提供了完备的基础。
本书可作为高等学校和科研单位从事人工智能、机器学习、模式识别、信号处理等方向的学生、教师和研究人员的教材和参考书。
== 序 言 ==
很高兴能够看到我们所著的《概率图模型》一书被翻译为中文出版。我们了解到这本书涵盖的课题已在中国引起了巨大的兴趣。已有众多中国读者写信向我们解释这本书对于他们的学习的重要性,并希望获得更易理解的版本。随着众多来自中国研究机构或国外研究机构的中国学者署名或共同署名的文章的发表,中国研究者已在概率图领域中扮演了非常重要的角色。这些文章对于概率图模型领域的发展起到了非常重要的作用。我们相信《概率图模型》中文版的出版将帮助许多中国读者学习并掌握这一重要课题的基础。同时,这也将进一步提高中国学者应用概率图模型思想的能力,并为这一领域的发展做出贡献。
本书的翻译工作由王飞跃研究员主导,并得到了王珏研究员及其众多助手和合作者的支持。这是一份历时 5年、具有里程碑意义的努力,我深深地感谢该团队所有为本书翻译做出贡献的人员。我尤其希望借此机会感谢王珏研究员——一位中国机器学习领域的开拓者。王珏研究员是此项翻译工作的十分重要的推动者。没有他的支持,没有他的众多杰出的机器学习领域的学生的帮助,可能这项工作到现在还没有结果。很遗憾王珏研究员于 2014年 12月死于癌症,终年 66岁,已不能看到他努力的结果。然而,他的思想活在他的学生们的工作中,与本书的出版同在。
Daphne Koller
(复杂系统管理与控制国家重点实验室王晓翻译)
行为统计学基础 豆瓣
作者: 理查德·P·鲁尼 译者: 王星 出版社: 中国人民大学 2007 - 6
对统计学的学习来说,最主要的是掌握统计思想,理解相关的统计原理,能够根据实际情境提出解决问题的一个或几个合适方案,并懂得选择其中的最优。因此适合非统计专业学生的统计学理想教材,应该是能兼顾专业特点、深入浅出阐述统计学基本原理和方法,同时在轻快风趣的讲述中激发读者的学习兴趣,培养统计思维,并辅之例题分析,对使用中容易发生的错误加以提醒,切实提高学生应用统计方法分析解决实际问题的能力。《行为统计学基础》(第9版)正是这样一本非常出色的教材。本书写作风格轻松活泼,语言流畅易懂,数学深入浅出,读者在学习和阅读时不会感到枯燥乏味。
本书是心理和教育统计学方面的一本优秀的基础教材,对于在社会科学领域中的广大研究人员来说,也是一本不可多得的重要参考书
科学前沿图谱:知识可视化的探索(第二版) 豆瓣
[美]陈超美
作者: 陈超美著;陈悦等 译者: 陈悦 / 王贤文 出版社: 科学出版社有限责任公司 2015 - 3
本书从跨学科的视角探索了知识可视化的历史进程及其最新进展。从无形学院和库恩竞争范式,到运用可视化技术绘制知识结构图谱,再到科学发展进程中的各种兴盛与衰落。通过大量色彩丰富的图片,深入浅出地将绘制科学知识图谱的原理、方法及技术娓娓道来。
本书既涉及到简单易学的可视化步骤和模型,也有应用于实际的具体案例分析,是一本对于研究者和实践者都很有价值的参考书,可供科学政策分析机构、投资机构、咨询公司管理人员、技术人员和高校相关专业师生阅读参考。
Learning with Kernels 豆瓣
作者: Bernhard Schlkopf / Alexander J. Smola 出版社: The MIT Press 2001
In the 1990s, a new type of learning algorithm was developed, based on results from statistical learning theory: the Support Vector Machine (SVM). This gave rise to a new class of theoretically elegant learning machines that use a central concept of SVMs -- -kernels--for a number of learning tasks. Kernel machines provide a modular framework that can be adapted to different tasks and domains by the choice of the kernel function and the base algorithm. They are replacing neural networks in a variety of fields, including engineering, information retrieval, and bioinformatics.Learning with Kernels provides an introduction to SVMs and related kernel methods. Although the book begins with the basics, it also includes the latest research. It provides all of the concepts necessary to enable a reader equipped with some basic mathematical knowledge to enter the world of machine learning using theoretically well-founded yet easy-to-use kernel algorithms and to understand and apply the powerful algorithms that have been developed over the last few years.
实验设计与分析 豆瓣
作者: (美)蒙哥马利(Montgomery,D.C) 译者: 傅钰生等 出版社: 人民邮电出版社 2009 - 1
本书作为实验设计与分析领域的名著, 是作者在亚利桑那州立大学、华盛顿大学和佐治亚理工学院三所大学近40年实验设计教学经验的基础上编写的. 全书内容广泛, 实例丰富,包括简单比较试验、析因设计、分式析因第1章设计、拟合回归模型、响应曲面方法和设计、稳健参数设计和过程稳健性研究、含随机因子的实验、嵌套设计和裂区设计等.
本书可作为自然科学研究人员、工程技术人员、管理人员进行科学实验设计与分析的参考书, 也可作为农林类、医学类、生物类、统计类的教师和高年级本科生和研究生的教学参考用书.
时间序列分析的小波方法 豆瓣
作者: 珀西瓦尔 出版社: 机械工业出版社 2006 - 3
时间序列分析是用随机过程理论和数理统计学的方法,研究随机数据序列所遵从的统计规律,用于解决科研、工程技术、金融及经济等诸多领域内的实际问题。本书是一本由浅入深的小波分析导论,介绍了基于小波的时间序列统计分析。实践中的离散时间技术是本书的论述重点,同时对于理解和实现离散小波变换将涉及的诸多原理与算法也进行了详细的描述。
本书详细地介绍了小波方法在时间序列分析中的应用,图例丰富,语言简明易懂,论述严谨,另外,本书对小波分析所需要的数学知识进行了简洁实用的讲解,还在正文中嵌入了大量的练习,并在附录中给出了这些练习的答案,同时每章另备有适于课堂布置的练习。
本书适合作为高等院校统计学、数学等专业学生的教材,同时也可作为从事相关领域研究的人员的参考书。
计算广告 豆瓣
8.0 (7 个评分) 作者: 刘鹏 / 王超 出版社: 人民邮电出版社 2015 - 9
计算广告是一项新兴的研究课题,它涉及大规模搜索和文本分析、信息获取、统计模型、机器学习、分类、优化以及微观经济学等诸多领域的知识。本书从实践出发,系统地介绍计算广告的产品、问题、系统和算法,并且从工业界的视角对这一领域具体技术的深入剖析。
本书立足于广告市场的根本问题,从计算广告各个阶段所遇到的市场挑战出发,以广告系统业务形态的需求和变化为主线,依次介绍合约广告系统、竞价广告系统、程序化交易市场等重要课题,并对计算广告涉及的关键技术和算法做深入的探讨。
无论是互联网公司商业化部门的产品技术人员,还是对个性化系统、大数据变现或交易有兴趣的产品技术人员,传统企业互联网化进程的决策者,传统广告业务的从业者,互联网创业者,计算机相关专业研究生,都会从阅读本书中受益匪浅。
本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。
Networks, Crowds, and Markets 豆瓣 Goodreads
作者: Jon Kleinberg / David Easley 出版社: Cambridge University Press 2010 - 7
Are all film stars linked to Kevin Bacon? Why do the stock markets rise and fall sharply on the strength of a vague rumour? How does gossip spread so quickly? Are we all related through six degrees of separation? There is a growing awareness of the complex networks that pervade modern society. We see them in the rapid growth of the Internet, the ease of global communication, the swift spread of news and information, and in the way epidemics and financial crises develop with startling speed and intensity. This introductory book on the new science of networks takes an interdisciplinary approach, using economics, sociology, computing, information science and applied mathematics to address fundamental questions about the links that connect us, and the ways that our decisions can have consequences for others.
Learning From Data 豆瓣
10.0 (7 个评分) 作者: Yaser S. Abu-Mostafa / Malik Magdon-Ismail 出版社: AMLBook 2012 - 3
Machine learning allows computational systems to adaptively improve their performance with experience accumulated from the observed data. Its techniques are widely applied in engineering, science, finance, and commerce. This book is designed for a short course on machine learning. It is a short course, not a hurried course. From over a decade of teaching this material, we have distilled what we believe to be the core topics that every student of the subject should know. We chose the title `learning from data' that faithfully describes what the subject is about, and made it a point to cover the topics in a story-like fashion. Our hope is that the reader can learn all the fundamentals of the subject by reading the book cover to cover. ---- Learning from data has distinct theoretical and practical tracks. In this book, we balance the theoretical and the practical, the mathematical and the heuristic. Our criterion for inclusion is relevance. Theory that establishes the conceptual framework for learning is included, and so are heuristics that impact the performance of real learning systems. ---- Learning from data is a very dynamic field. Some of the hot techniques and theories at times become just fads, and others gain traction and become part of the field. What we have emphasized in this book are the necessary fundamentals that give any student of learning from data a solid foundation, and enable him or her to venture out and explore further techniques and theories, or perhaps to contribute their own. ---- The authors are professors at California Institute of Technology (Caltech), Rensselaer Polytechnic Institute (RPI), and National Taiwan University (NTU), where this book is the main text for their popular courses on machine learning. The authors also consult extensively with financial and commercial companies on machine learning applications, and have led winning teams in machine learning competitions.
Applied Predictive Modeling 豆瓣 Goodreads
作者: Max Kuhn / Kjell Johnson 出版社: Springer 2013 - 9
This text is intended for a broad audience as both an introduction to predictive models as well as a guide to applying them. Non-mathematical readers will appreciate the intuitive explanations of the techniques while an emphasis on problem-solving with real data across a wide variety of applications will aid practitioners who wish to extend their expertise. Readers should have knowledge of basic statistical ideas, such as correlation and linear regression analysis. While the text is biased against complex equations, a mathematical background is needed for advanced topics. Dr. Kuhn is a Director of Non-Clinical Statistics at Pfizer Global R&D in Groton Connecticut. He has been applying predictive models in the pharmaceutical and diagnostic industries for over 15 years and is the author of a number of R packages. Dr. Johnson has more than a decade of statistical consulting and predictive modeling experience in pharmaceutical research and development. He is a co-founder of Arbor Analytics, a firm specializing in predictive modeling and is a former Director of Statistics at Pfizer Global R&D. His scholarly work centers on the application and development of statistical methodology and learning algorithms.