数据分析
Super Crunchers 豆瓣
作者: Ian Ayres Bantam 2007 - 8
Why would a casino try and stop you from losing? How can a mathematical formula find your future spouse? Would you know if a statistical analysis blackballed you from a job you wanted?

Today, number crunching affects your life in ways you might never imagine. In this lively and groundbreaking new book, economist Ian Ayres shows how today's best and brightest organizations are analyzing massive databases at lightening speed to provide greater insights into human behavior. They are the Super Crunchers. From internet sites like Google and Amazon that know your tastes better than you do, to a physician's diagnosis and your child's education, to boardrooms and government agencies, this new breed of decision makers are calling the shots. And they are delivering staggeringly accurate results. How can a football coach evaluate a player without ever seeing him play? Want to know whether the price of an airline ticket will go up or down before you buy? How can a formula outpredict wine experts in determining the best vintages? Super crunchers have the answers. In this brave new world of equation versus expertise, Ayres shows us the benefits and risks, who loses and who wins, and how super crunching can be used to help, not manipulate us.

Gone are the days of solely relying on intuition to make decisions. No businessperson, consumer, or student who wants to stay ahead of the curve should make another keystroke without reading Super Crunchers.
2018年2月13日 已读
先看了2016年出版的《what the luck》,然后看的这本儿2007年的书。两本都是对统计分析方法的科普书籍,本书比《what the luck》要强百倍。
economics 数据分析 经济学 统计
我的第一本算法书 豆瓣
アルゴリズム図鑑
8.1 (16 个评分) 作者: [日]石田保辉 / [日]宮崎修一 译者: 张贝 人民邮电出版社 2018 - 11
本书采用大量图片,通过详细的分步讲解,以直观、易懂的方式展现了7个数据结构和26个基础算法的基本原理。第1章介绍了链表、数组、栈等7个数据结构;从第2章到第7章,分别介绍了和排序、查找、图论、安全、聚类等相关的26个基础算法,内容涉及冒泡排序、二分查找、广度优先搜索、哈希函数、迪菲 - 赫尔曼密钥交换、k-means 算法等。
本书没有枯燥的理论和复杂的公式,而是通过大量的步骤图帮助读者加深对数据结构原理和算法执行过程的理解,便于学习和记忆。将本书作为算法入门的第一步,是非常不错的选择。
Python数据科学指南 豆瓣
作者: 印度 Gopi Subramanian 萨伯拉曼尼安 人民邮电出版社 2016 - 11
本书从讲解如何在数据科学中应用Python开始,陆续介绍了Python的工作环境,如何用Python分析数据,以及数据挖掘的概念,然后又扩展到机器学习。本书还涵盖了缩减原则、集成方法、随机森林、旋转森林和超树等方面的内容,这些都是一个成功的数据科学专家所必需掌握的。
阅读本书,你将学会:
■ 揭示数据科学算法的完整范畴;
■ 高效地掌握和使用numpy、scipy、scikit-learn和matplotlib等Python库;
■ 了解进阶回归方法的建模和变量选择;
■ 进一步彻底理解集成方法的潜在含义及实施;
■ 在各种各样的数值和文本数据集上解决实际问题;
■ 熟悉先进的算法,如梯度提升、随机森林、旋转森林等。
本书特色:
■ 内容明确且易于跟学;
■ 甄选重要的任务与问题;
■ 精心组织编排内容,有效解决问题;
■ 清晰易懂的讲解方式;
■ 书中呈现的解决方案能够直接应用到实际问题中。
深入浅出Pandas 豆瓣
作者: 李庆辉 机械工业出版社 2021 - 7
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python工程师,你应该先学好Pandas。
这是一本全面覆盖了Pandas使用者的普遍需求和痛点的著作,基于实用、易学的原则,从功能、使用、原理等多个维度对Pandas做了全方位的详细讲解,既是初学者系统学习Pandas难得的入门书,又是有经验的Python工程师案头必不可少的查询手册。
本书共17章,分为七部分。
第1部分(第1~2章) Pandas入门
首先介绍了Pandas的功能、使用场景和学习方法,然后详细讲解了Python开发环境的搭建,Z后介绍了Pandas的大量基础功能,旨在引领读者快速入门。
第二部分(第3~5章) Pandas数据分析基础
详细讲解了Pandas读取与输出数据、索引操作、数据类型转换、查询筛选、统计计算、排序、位移、数据修改、数据迭代、函数应用等内容。
第三部分(第6~9章) 数据形式变化
讲解了Pandas的分组聚合操作、合并操作、对比操作、数据透视、转置、归一化、标准化等,以及如何利用多层索引对数据进行升降维。
第四部分(第10~12章) 数据清洗
讲解了缺失值和重复值的识别、删除、填充,数据的替换、格式转换,文本的提取、连接、匹配、切分、替换、格式化、虚拟变量化等,以及分类数据的应用场景和操作方法。
第五部分(第13~14章)时序数据分析
讲解了Pandas中对于各种时间类型数据的处理和分析,以及在时序数据处理中经常使用的窗口计算。
第六部分(第15~16章) 可视化
讲解了Pandas的样式功能如何让数据表格更有表现力,以及Pandas的绘图功能如何让数据自己说话。
第七部分(第17章) 实战案例
介绍了从需求到代码的思考过程,如何利用链式编程思想提高代码编写和数据分析效率,以及数据分析的基本方法与需要掌握的数据分析工具和技术栈,此外还从数据处理和数据分析两个角度给出了大量的应用案例及代码详解。
2022年12月29日 已读
Pandas 是神器,Python做数据处理的,绕不过它去。本书介绍的Pandas的多数功能。最后的案例吃透,就能胜任许多的分析工作啦。
python 数据分析 编程