NeoDB - Darren - 标签

数据不说谎豆瓣

作者: 城市数据团 2017 - 6

这是一本让你“脑洞大开”的图书，让你尝试从大数据角度来解读这个世界，你会发现，有些问题，和你的直觉完全不一样。本书内容分为三部分：*部分可概括为“脑洞大开”，以*、旅游、餐馆取名等不同的角度切入，说明数据可以用于做许多有趣的事情。第二部分数据与工作，包括了做公务员、二三线城市的衰落、创业等若干热门话题。第三部分数据与生活，包括用数据帮助理解生活现象、用数据挖掘生活中的趣味、以及用数字看房市三个专题。

人人都在说谎豆瓣

Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are

7.2 (11 个评分) 作者: 赛思·斯蒂芬斯--达维多维茨译者: 胡晓姣 / 张晨 … 中信出版集团 2018 - 11

有多少人买了书真正看完了？
你朋友的酒量有他说的那么大吗？
父母是否暗自喜欢男孩儿多于女孩儿？
电影里暴力镜头增多会导致犯罪率升高吗？
种族歧视在现如今的美国还严重吗？
特朗普的胜利有征兆吗，什么促成他赢得了大选？
……
你知道问题的答案吗，直觉会怎样告诉你？
作者赛思·斯蒂芬斯--达维多维茨是一位前谷歌数据科学家和专栏作家。他的研究发现，世界充满了谎言，人类或出于善意或出于恶意，无时无刻不在说谎。对于以上以及类似的很多问题，传统的统计调研方法得出的结论很多是错误的，误导了我们的认知。
但是，人们往往在一个地方放下戒备、吐露心声，那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据，暴露着你的真实想法、欲望、恐惧和职业，而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。
在这本应时的力作中，作者从一个个备受关注的话题切入，用他独特的数据分析方法得出了很多颠覆认知的结论。很多问题的答案正暗藏于看似没有关联的因素中，很多直觉和经验给出的答案与事实相差千里，大数据被合理使用其实比数据库的大更重要……作者广博的知识面将从多个层面拓展我们的认知边界；书中生动有趣的描写让你不想错过任何一个细节。
有媒体评论，这本书融合了《信号与噪声》的合理分析与《鬼才思考术》的脑洞。它以一个引人入胜、充满启迪和智慧的视角，巧妙洞察我们现在可获得的大量信息，为我们提供了实用的数据分析方法，同时也揭示了深深埋藏在数据背后世界本来的样貌。对于想要通过数据了解和分析人类行为与社会的人而言，这本书精彩不容错过。

百面机器学习豆瓣

8.8 (5 个评分) 作者: 诸葛越 / 葫芦娃人民邮电出版社 2018 - 8

人工智能领域正在以超乎人们想象的速度发展，本书赶在人工智能彻底占领世界之前完成编写，实属万幸。
书中收录了超过100道机器学习算法工程师的面试题目和解答，其中大部分源于Hulu算法研究岗位的真实场景。本书从日常工作、生活中各种有趣的现象出发，不仅囊括了机器学习的基本知识，而且还包含了成为出众算法工程师的相关技能，更重要的是凝聚了笔者对人工智能领域的一颗热忱之心，旨在培养读者发现问题、解决问题、扩展问题的能力，建立对机器学习的热爱，共绘人工智能世界的宏伟蓝图。
“不积跬步，无以至千里”，本书将从特征工程、模型评估、降维等经典机器学习领域出发，构建一个算法工程师必-备的知识体系；见神经网络、强化学习、生成对抗网络等新科研进展之微，知深度学习领域胜败兴衰之著；“博观而约取，厚积而薄发”，在末一章为读者展示生活中各种引领时代的人工智能应用。

数据之美豆瓣

Data Points: Visualization That Means Something

7.7 (7 个评分) 作者: 邱南森 (Nathan Yau) 译者: 张伸中国人民大学出版社 2014 - 2

这是一本教我们如何制作完美可视化图表，挖掘大数据背后意义的书。作者认为，可视化是一种媒介，向我们揭示了数据背后的故事。他循序渐进、深入浅出地道出了数据可视化的步骤和思想。本书让我们知道了如何理解数据可视化，如何探索数据的模式和寻找数据间的关联，如何选择适合自己的数据和目的的可视化方式，有哪些我们可以利用的可视化工具以及这些工具各有怎样的利弊。
作者给我们提供了丰富的可视化信息以及查看、探索数据的多元视角，丰富了我们对于数据、对于可视化的认知。对那些对设计和分析过程感兴趣的人，本书无疑就是一本必读书。

利用Python进行数据分析（原书第2版）豆瓣

Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython

8.6 (7 个评分) 作者: [美] Wes McKinney 译者: 徐敬一机械工业出版社 2018 - 7

本书由pandas项目创始人Wes McKinney亲笔撰写，详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。第2版针对Python 3.6进行全面修订和更新，涵盖新版的pandas、NumPy、IPython和Jupyter，并增加大量实际案例，可以帮助你高效解决一系列数据分析问题。
第2版中的主要更新包括：
• 所有的代码，包括把Python的教程更新到了Python 3.6版本（第1版中使用的是Python 2.7）
• 更新了Python第三方发布版Anaconda和其他所需Python包的安装指引
• 更新pandas库到2017年的新版
• 新增一章，关于更多高级pandas工具和一些使用提示
• 新增statsmodels和scikit-learn的简明使用介绍

机器学习豆瓣

8.5 (40 个评分) 作者: 周志华清华大学出版社 2016 - 1

机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材，在内容上尽可能涵盖机器学习基础知识的各方面。为了使尽可能多的读者通过本书对机器学习有所了解, 作者试图尽可能少地使用数学知识. 然而, 少量的概率、统计、代数、优化、逻辑知识似乎不可避免. 因此, 本书更适合大学三年级以上的理工科本科生和研究生, 以及具有类似背景的对机器学习感兴趣的人士. 为方便读者, 本书附录给出了一些相关数学基础知识简介.
全书共16 章，大致分为3 个部分：第1 部分（第1～3 章）介绍机器学习的基础知识；第2 部分（第4～10 章）讨论一些经典而常用的机器学习方法（决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习）；第3 部分（第11～16 章）为进阶知识，内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等.前3章之外的后续各章均相对独立, 读者可根据自己的兴趣和时间情况选择使用. 根据课时情况, 一个学期的本科生课程可考虑讲授前9章或前10章; 研究生课程则不妨使用全书.
书中除第1章外, 每章都给出了十道习题. 有的习题是帮助读者巩固本章学习, 有的是为了引导读者扩展相关知识. 一学期的一般课程可使用这些习题, 再辅以两到三个针对具体数据集的大作业. 带星号的习题则有相当难度, 有些并无现成答案, 谨供富有进取心的读者启发思考.
本书可作为高等院校计算机、自动化及相关专业的本科生或研究生教材，也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。

数据科学实战豆瓣

Doing Data Science: Straight Talk from the Frontline

作者: [美] Rachel Schutt / [美] Cathy O'Neil 译者: 冯凌秉 / 王群锋人民邮电出版社 2015 - 3

• 统计推断、探索性数据分析（EDA）及数据科学工作流程
• 算法
• 垃圾邮件过滤、朴素贝叶斯和数据清理
• 逻辑回归
• 金融建模
• 推荐引擎和因果关系
• 数据可视化
• 社交网络与数据新闻
• 数据工程、MapReduce、Pregel和Hadoop

Python数据分析豆瓣

Python Data Analysis

作者: [美] 阿曼多·凡丹戈译者: 韩波 2018 - 6

机器学习与R语言（原书第2版）豆瓣

作者: 布雷特·兰茨 (Brett Lantz) 译者: 李洪成 2017 - 3

An Introduction to Statistical Learning 豆瓣 Goodreads

9.8 (12 个评分) 作者: Gareth James / Daniela Witten … Springer 2013 - 8

An Introduction to Statistical Learning provides an accessible overview of the field of statistical learning, an essential toolset for making sense of the vast and complex data sets that have emerged in fields ranging from biology to finance to marketing to astrophysics in the past twenty years. This book presents some of the most important modeling and prediction techniques, along with relevant applications. Topics include linear regression, classification, resampling methods, shrinkage approaches, tree-based methods, support vector machines, clustering, and more. Color graphics and real-world examples are used to illustrate the methods presented. Since the goal of this textbook is to facilitate the use of these statistical learning techniques by practitioners in science, industry, and other fields, each chapter contains a tutorial on implementing the analyses and methods presented in R, an extremely popular open source statistical software platform. Two of the authors co-wrote The Elements of Statistical Learning (Hastie, Tibshirani and Friedman, 2nd edition 2009), a popular reference book for statistics and machine learning researchers. An Introduction to Statistical Learning covers many of the same topics, but at a level accessible to a much broader audience. This book is targeted at statisticians and non-statisticians alike who wish to use cutting-edge statistical learning techniques to analyze their data. The text assumes only a previous course in linear regression and no knowledge of matrix algebra.

数据挖掘导论豆瓣

作者: Pang-Ning Tan / Michael Steinbach … 译者: 范明 / 范宏建人民邮电出版社 2010

本书全面介绍了数据挖掘，涵盖了五个主题：数据、分类、关联分析、聚类和异常检测。除异常检测外，每个主题都有两章。前一章涵盖基本概念、代表性算法和评估技术，而后一章讨论高级概念和算法。这样读者在透彻地理解数据挖掘的基础的同时，还能够了解更多重要的高级主题。
本书是明尼苏达大学和密歇根州立大学数据挖掘课程的教材，由于独具特色，正式出版之前就已经被斯坦福大学、得克萨斯大学奥斯汀分校等众多名校采用。
本书特色
 与许多其他同类图书不同，本书将重点放在如何用数据挖掘知识解决各种实际问题。
 只要求具备很少的预备知识——不需要数据库背景，只需要很少的统计学或数学背景知识。
 书中包含大量的图表、综合示例和丰富的习题，并且使用示例、关键算法的简洁描述和习题，尽可能直接地聚焦于数据挖掘的主要概念。
 教辅内容极为丰富，包括课程幻灯片、学生课题建议、数据挖掘资源（如数据挖掘算法和数据集）、联机指南（使用实际的数据集和数据分析软件，为本书介绍的部分数据挖掘技术提供例子讲解）。
 向采用本书作为教材的教师提供习题解答。

深入浅出统计学豆瓣

Head First Statistics

9.2 (5 个评分) 作者: Dawn Griffiths 译者: 李芳电子工业出版社 2011 - 1

样章试读请到下面的链接下载：
目录 http://goo.gl/tlCLf
序言 http://goo.gl/65x6e
第一章 http://goo.gl/WTnC9
第二章 http://goo.gl/5WUhT
若下载遇到问题，请邮件联系：lispython@gmail.com。谢谢！
《深入浅出统计学》具有深入浅出系列的一贯特色，提供最符合直觉的理解方式，让统计理论的学习既有趣又自然。从应对考试到解决实际问题，无论你是学生还是数据分析师，都能从中受益。本书涵盖的知识点包括：信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与回归等等，完整涵盖AP 考试范围。本书运用充满互动性的真实世界情节，教给你有关这门学科的所有基础，为这个枯燥的领域带来鲜活的乐趣，不仅让你充分掌握统计学的要义，更会告诉你如何将统计理论应用到日常生活中。

赤裸裸的统计学豆瓣

Naked Statistics: Stripping the Dread from the Data

8.3 (13 个评分) 作者: [美]查尔斯·韦兰译者: 曹槟中信出版社 2013 - 9

视频网站是如何知道你喜欢的电影类型的？
哪些人最有可能成为恐怖分子？
我们应该依据什么来评估教学质量，从而帮助孩子选对学校？
商场是如何在你的家人之前就知道你怀孕的消息的？
基尼系数是衡量社会分配公平程度最完美的指标吗？
买福利彩票，去赌场豪赌，投资股票或期货，哪种方式让你跻身富豪排行榜的可能性更大？
“缺乏控制力和话语权”的工作，还是“权力大，责任也大”的工作，更容易让职场人士猝死？
不止这些，生活中你遇到的各种问题都离不开数据和统计学。
统计学已经成为大数据时代最炙手可热的学问。它可以帮我们解决很多琐碎的生活问题和重要的社会问题，并对“黑天鹅”事件和未来做出预测。
这本书没有让你避之不及的数学公式，没有满是数字的图表，没有空洞乏味的教科书式说教；这本书有生动诙谐的案例，有你熟悉的生活话题和社会问题，有你一定用得到的统计学知识，有大数据时代的“游戏规则”和“生存法则”。
本书将是你遇到过的最好的“数学老师”，它装满了具有现实意义的“课程”，比如为什么一流大学毕业生的收入会高于普通大学毕业生，还有为什么不要买彩票。
众所周知，在生活中统计学无处不在，每件事、每个人似乎都可以用统计数字来加以说明。特别是进入大数据时代以后，统计学更是成为炙手可热的学问，它可以帮我们解决很多重要的社会问题，并对“黑天鹅”事件和未来做出预测。
但不可否认的是，统计学本身因为囊括大量的数学内容及专业术语，以至于让人觉得高深莫测、很难亲近。
《赤裸裸的统计学》一书的作者查尔斯•惠伦“扒光”了统计学“沉闷的外衣”，用生活中有趣的案例、直观的图表、生动诙谐的语言风格，彻底揭开了统计学、大数据和数字的“神秘面纱”，让我们知道权威期刊、媒体新闻、民意调研中公布的数字从何而来，轻松掌握判断这些统计数字“是否在撒谎”的秘籍。同时，作者还将统计学的工具带入日常生活中，告诉我们为什么不要买彩票，为什么你家附近的商场会知道你怀孕的消息并给你寄来纸尿裤的优惠券，等等。
大数据时代你必须掌握的统计学知识，全部都在这本书中。从今天开始，好好使用统计学和数据吧！

商务与经济统计豆瓣

作者: 安德森(Anderson D R.) / 斯威尼(Sweeney D J.) … 机械工业出版社 2012 - 4

商务与经济统计（原书第11版），ISBN：9787111376415，作者：（美）安德森，（美）斯威尼，（美）威廉斯著，张建华等译