“tag:可视化”
全部 | 书籍 (86) | 影视 | 播客 | 音乐 | 游戏 | 演出
纽约:一座超级城市是如何运转的 [图书] 豆瓣
The Works: Anatomy of a City
7.6 (7 个评分) 作者: [美] 凯特·阿歇尔 译者: 潘文捷 南海出版公司 2018 - 4
《纽约:一座超级城市是如何运转的》是一本科普图书,生动有趣地讲述城市是如何运转的。
纽约这座繁华都市拥有极为密集的基础设施群。这里的每一天,二十八条地铁线要运送乘客四百五十万人次,足以绕地球三圈的地下电缆要满足市区堪比欧洲小国的用电量,供水系统要输送数百万吨净水,垃圾处理系统要将两万五千吨垃圾运出城外。
如此巨大的工程量能平稳高效地达成,都仰赖于强大的基础设施。这座永不停歇的不夜城,是我们了解现代大城市运转原理的样本。城市规划专家凯特·阿歇尔运用简洁易懂的语言与精致的图画、详实的数据,带领我们探索现代都市背后的奥秘。
利用Python进行数据分析 [图书] 豆瓣
Python for Data Analysis
8.6 (13 个评分) 作者: Wes McKinney 译者: 唐学韬 机械工业出版社 2013 - 11
【名人推荐】
“科学计算和数据分析社区已经等待这本书很多年了:大量具体的实践建议,以及大量综合应用方法。本书在未来几年里肯定会成为Python领域中技术计算的权威指南。”
——Fernando Pérez 加州大学伯克利分校 研究科学家, IPython的创始人之一
【内容简介】
还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。
由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
•将IPython这个交互式Shell作为你的首要开发环境。
•学习NumPy(Numerical Python)的基础和高级知识。
•从pandas库的数据分析工具开始。
•利用高性能工具对数据进行加载、清理、转换、合并以及重塑。
•利用matplotlib创建散点图以及静态或交互式的可视化结果。
•利用pandas的groupby功能对数据集进行切片、切块和汇总操作。
•处理各种各样的时间序列数据。
•通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。
The Visual Display of Quantitative Information [图书] 豆瓣 Goodreads
The Visual Display of Quantitative Information
8.8 (5 个评分) 作者: Edward R. Tufte Graphics Pr 2001 - 1
The classic book on statistical graphics, charts, tables. Theory and practice in the design of data graphics, 250 illustrations of the best (and a few of the worst) statistical graphics, with detailed analysis of how to display data for precise, effective, quick analysis. Design of the high-resolution displays, small multiples. Editing and improving graphics. The data-ink ratio. Time-series, relational graphics, data maps, multivariate designs. Detection of graphical deception: design variation vs. data variation. Sources of deception. Aesthetics and data graphical displays.
This is the second edition of The Visual Display of Quantitative Information. Recently published, this new edition provides excellent color reproductions of the many graphics of William Playfair, adds color to other images, and includes all the changes and corrections accumulated during 17 printings of the first edition.
This book celebrates escapes from the flatlands of both paper and computer screen, showing superb displays of high-dimensional complex data. The most design-oriented of Edward Tufte's books, Envisioning Information shows maps, charts, scientific presentations, diagrams, computer interfaces, statistical graphics and tables, stereo photographs, guidebooks, courtroom exhibits, timetables, use of color, a pop-up, and many other wonderful displays of information. The book provides practical advice about how to explain complex material by visual means, with extraordinary examples to illustrate the fundamental principles of information displays. Topics include escaping flatland, color and information, micro/macro designs, layering and separation, small multiples, and narratives. Winner of 17 awards for design and content. 400 illustrations with exquisite 6- to 12-color printing throughout. Highest quality design and production.
Visual Explanations: Images and Quantities, Evidence and Narrative is about pictures of verbs, the representation of mechanism and motion, process and dynamics, causes and effects, explanation and narrative. Practical applications and examples include statistical graphics, charts for making important decisions in engineering and medicine, technical manuals, diagrams, design of computer interfaces and websites and on-line manuals, animations and scientific visualizations, techniques for talks, and design strategies for enhancing the rate of information transfer in print, presentations, and computer screens. The use of visual evidence in deciding to launch the space shuttle Challenger is discussed in careful detail. Video snapshots show redesigns of a supercomputer animation of a thunderstorm. The book is designed and printed to the highest standards, with luscious color throughout and four built-in flaps for showing motion and before/after effects.
Storytelling with Data [图书] 豆瓣
8.3 (7 个评分) 作者: Cole Nussbaumer Knaflic Wiley 2015 - 11
Don't simply show your data—tell a story with it!
Storytelling with Data teaches you the fundamentals of data visualization and how to communicate effectively with data. You'll discover the power of storytelling and the way to make data a pivotal point in your story. The lessons in this illuminative text are grounded in theory, but made accessible through numerous real-world examples—ready for immediate application to your next graph or presentation.
Storytelling is not an inherent skill, especially when it comes to data visualization, and the tools at our disposal don't make it any easier. This book demonstrates how to go beyond conventional tools to reach the root of your data, and how to use your data to create an engaging, informative, compelling story. Specifically, you'll learn how to:
Understand the importance of context and audience
Determine the appropriate type of graph for your situation
Recognize and eliminate the clutter clouding your information
Direct your audience's attention to the most important parts of your data
Think like a designer and utilize concepts of design in data visualization
Leverage the power of storytelling to help your message resonate with your audience
Together, the lessons in this book will help you turn your data into high impact visual stories that stick with your audience. Rid your world of ineffective graphs, one exploding 3D pie chart at a time. There is a story in your data—Storytelling with Data will give you the skills and power to tell it!
还有1个属于同一作品或可能重复的条目,点击显示。
用数据讲故事 [图书] 豆瓣
8.7 (6 个评分) 作者: [美] Cole Nussbaumer Knaflic 译者: 陆昊 / 吴梦颖 人民邮电出版社 2017 - 8
本书通过大量案例研究介绍数据可视化的基础知识,以及如何利用数据创造出吸引人的、信息量大的、有说服力的故事,进而达到有效沟通的目的。具体内容包括:如何充分理解上下文,如何选择合适的图表,如何消除杂乱,如何聚焦受众的视线,如何像设计师一样思考,以及如何用数据讲故事。
R语言实战 [图书] 豆瓣
R in Action
9.3 (6 个评分) 作者: 卡巴科弗 译者: 高涛 / 肖楠 人民邮电出版社 2013 - 1
数据时代已经到来,但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响, 相对于经验和直觉,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。  本书从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧!  本书内容:  R安装与操作
数据导入/导出及格式化双变量关系的描述性分析回归分析
模型适用性的评价方法以及结果的可视化
用图形实现变量关系的可视化
在给定置信度的前提下确定样本量
高级统计分析方法和高级绘图
复分析 [图书] 豆瓣
Visual Complex Analysis
作者: (美) 尼达姆 (Needham, T.) 译者: 齐民友 人民邮电出版社 2009 - 7
《复分析:可视化方法》是复分析领域的一部名著,开创了数学领域的可视化潮流,自首次出版以来,已重印了十多次,深受世界读者好评。
《复分析:可视化方法》用一种真正不同寻常的、独具创造性的视角和可以看得见的论证方式解释初等复分析的理论,公开挑战当前占统治地位的纯符号逻辑推理。作者通过大量的图示使原本比较抽象的数学概念,变得直观易懂,读者在透彻理解理论的同时,还能充分领略数学之美。
-------
目录
第1章 几何和复算术. 1
1.1 引言 1
1.1.1 历史的概述 1
1.1.2 庞贝利的"奇想" 3
1.1.3 一些术语和记号 5
1.1.4 练习 6
1.1.5 符号算术和几何算术的等价性 7
1.2 欧拉公式 8
1.2.1 引言 8
1.2.2 用质点运动来论证 9
1.2.3 用幂级数来论证 10
1.2.4 用欧拉公式来表示正弦和余弦 12
1.3 一些应用 12
1.3.1 引言 12
1.3.2 三角 13
1.3.3 几何 14
1.3.4 微积分 17
1.3.5 代数 19
1.3.6 向量运算 24
1.4 变换与欧氏几何 26
1.4.1 克莱因眼中的几何 26
1.4.2 运动的分类 30
1.4.3 三反射定理 32
1.4.4 相似性与复算术 34
1.4.5 空间复数 37
1.5 习题 3
第2章 作为变换看的复函数 47
2.1 引言 47
2.2 多项式 49
2.2.1 正整数幂 49
2.2.2 回顾三次方程 50
2.2.3 卡西尼曲线 51
2.3 幂级数 54
2.3.1 实幂级数的神秘之处 54
2.3.2 收敛圆 57
2.3.3 用多项式逼近幂级数 60
2.3.4 唯一性 61
2.3.5 对幂级数的运算 62
2.3.6 求收敛半径 64
2.3.7 傅里叶级数 67
2.4 指数函数 69
2.4.1 幂级数方法 69
2.4.2 这个映射的几何意义 70
2.4.3 另一种方法 71
2.5 余弦与正弦 73
2.5.1 定义与恒等式 73
2.5.2 与双曲函数的关系 74
2.5.3 映射的几何 76
2.6 多值函数 78
2.6.1 例子:分数幂 78
2.6.2 多值函数的单值支 80
2.6.3 与幂级数的关联 82
2.6.4 具有两个支点的例子 83
2.7 对数函数 85
2.7.1 指数函数的逆 85
2.7.2 对数幂级数 87
2.7.3 一般幂级数 88
2.8 在圆周上求平均值 89
2.8.1 质心 89
2.8.2 在正多边形上求平均值 91
2.8.3 在圆周上求平均值 94
2.9 习题 96
第3章 默比乌斯变换和反演 106
3.1 引言 106
3.1.1 默比乌斯变换的定义和意义 106
3.1.2 与爱因斯坦相对论的联系 107
3.1.3 分解为简单的变换 107
3.2 反演 108
3.2.1 初步的定义和事实 108
3.2.2 圆周的保持 110
3.2.3 用正交圆周构作反演点 112
3.2.4 角的保持 114
3.2.5 对称性的保持 115
3.2.6 对球面的反演 116
3.3 反演应用的三个例子 118
3.3.1 关于相切圆的问题 118
3.3.2 具有正交对角线的四边形的一个奇怪的性质 119
3.3.3 托勒密定理 120
3.4 黎曼球面 121
3.4.1 无穷远点 121
3.4.2 球极射影 121
3.4.3 把复函数转移到球面上 124
3.4.4 函数在无穷远点的性态 125
3.4.5 球极射影的公式 127
3.5 默比乌斯变换:基本结果 129
3.5.1 圆周.角度和对称性的保持 129
3.5.2 系数的非唯一性 130
3.5.3 群性质 131
3.5.4 不动点 132
3.5.5 无穷远处的不动点 132
3.5.6 交比 134
3.6 默比乌斯变换作为矩阵 136
3.6.1 与线性代数的联系的经验上的证据 136
3.6.2 解释:齐次坐标 138
3.6.3 特征向量与特征值 139
3.6.4 球面的旋转作为默比乌斯变换 141
3.7 可视化与分类 143
3.7.1 主要思想 143
3.7.2 椭圆型.双曲型和斜驶型变换 144
3.7.3 乘子的局部几何解释 146
3.7.4 抛物型变换 147
3.7.5 计算乘子 149
3.7.6 用特征值解释乘子 150
3.8 分解为2个或4个反射 151
3.8.1 引言 151
3.8.2 椭圆型情况 151
3.8.3 双曲型情况 152
3.8.4 抛物型情况 154
3.8.5 总结 154
3.9 单位圆盘的自同构 155
3.9.1 计算自由度的数目 155
3.9.2 用对称原理来求公式 156
3.9.3 最简单的公式的几何解释 157
3.9.4 介绍黎曼映射定理 158
3.10 习题 159
第4章 微分学:伸扭的概念 166
4.1 引言 166
4.2 一个令人迷惑的现象 166
4.3 平面映射的局部描述 168
4.3.1 引言 168
4.3.2 雅可比矩阵 168
4.3.3 伸扭的概念 170
4.4 复导数作为伸扭 170
4.4.1 重新考察实导数 170
4.4.2 复导数 171
4.4.3 解析函数 173
4.4.4 简短的总结 174
4.5 一些简单的例子 175
4.6 共形=解析 176
4.6.1 引言 176
4.6.2 在整个区域中的共形性 177
4.6.3 共形性与黎曼球面 179
4.7 临界点 179
4.7.1 挤压的程度 179
4.7.2 共形性的破坏 180
4.7.3 支点 181
4.8 柯西-黎曼方程 182
4.8.1 引言 182
4.8.2 线性变换的几何学 183
4.8.3 柯西-黎曼方程 184
4.9 习题 185
第5章 微分学的进一步的几何研究 190
5.1 柯西-黎曼的真面目 190
5.1.1 引言 190
5.1.2 笛卡儿形式 190
5.1.3 极坐标形式 191
5.2 关于刚性的一个启示 192
5.3 log(z)的可视微分法 195
5.4 微分学的各法则 196
5.4.1 复合 196
5.4.2 反函数 197
5.4.3 加法与乘法 198
5.5 多项式.幂级数和有理函数 198
5.5.1 多项式 198
5.5.2 幂级数 199
5.5.3 有理函数 201
5.6 幂函数的可视微分法 201
5.7 exp(z)的可视微分法 203
5.8 E'=E的几何解法 204
5.9 高阶导数的一个应用:曲率 206
5.9.1 引言 206
5.9.2 曲率的解析变换 207
5.9.3 复曲率 209
5.10 天体力学 212
5.10.1 有心力场 212
5.10.2 两类椭圆轨道 213
5.10.3 把第一种椭圆轨道变为第二种 215
5.10.4 力的几何学 216
5.10.5 一个解释 216
5.10.6 卡斯纳-阿诺尔德定理 217
5.11 解析拓展 218
5.11.1 引言 218
5.11.2 刚性 219
5.11.3 唯一性 220
5.11.4 恒等式的保持 222
5.11.5 通过反射作解析拓展 223
5.12 习题 227
第6章 非欧几何学 236
6.1 引言 236
6.1.1 平行线公理 236
6.1.2 非欧几何的一些事实 238
6.1.3 弯曲曲面上的几何学 239
6.1.4 内蕴几何与外在几何的对立 241
6.1.5 高斯曲率 241
6.1.6 常曲率曲面 243
6.1.7 与默比乌斯变换的联系 244
6.2 球面几何 245
6.2.1 球面三角形的角盈 245
6.2.2 球面上的运动:空间旋转和反射.. 246
6.2.3 球面上的一个共形映射 249
6.2.4 空间旋转也是默比乌斯变换 252
6.2.5 空间旋转与四元数 256
6.3 双曲几何 259
6.3.1 曳物线和伪球面 259
6.3.2 伪球面的常值负曲率 260
6.3.3 伪球面上的一个共形映射 261
6.3.4 贝尔特拉米的双曲平面 263
6.3.5 双曲直线和反射 266
6.3.6 鲍耶-罗巴切夫斯基公式 269
6.3.7 保向运动的三种类型 271
6.3.8 把任意保向运动分解为两个反射 275
6.3.9 双曲三角形的角盈 277
6.3.10 庞加莱圆盘 279
6.3.11 庞加莱圆盘中的运动 282
6.3.12 半球面模型与双曲空间 285
6.4 习题 289
第7章 环绕数与拓扑学 29
7.1 环绕数 298
7.1.1 定义 298
7.1.2 “内”是什么意思? 299
7.1.3 快速地求出环绕数 299
7.2 霍普夫映射度定理 301
7.2.1 结果 301
7.2.2 环路作为圆周的映射 301
7.2.3 解释 303
7.3 多项式与辐角原理 303
7.4 一个拓扑辐角原理 304
7.4.1 用代数方法来数原象个数 304
7.4.2 用几何方法来数原象个数 306
7.4.3 解析函数在拓扑上有何特殊 307
7.4.4 拓扑辐角原理 309
7.4.5 两个例子 310
7.5 鲁歇定理 311
7.5.1 结果 311
7.5.2 代数的基本定理 312
7.5.3 布劳威尔不动点定理 313
7.6 最大值与最小值 313
7.6.1 最大模原理 313
7.6.2 相关的结果 315
7.7 施瓦茨-皮克引理 315
7.7.1 施瓦茨引理 315
7.7.2 刘维尔定理 318
7.7.3 皮克的结果 319
7.8 广义辐角原理 321
7.8.1 有理函数 321
7.8.2 极点与本性奇点 323
7.8.3 解释 325
7.9 习题 326
第8章 复积分:柯西定理 334
8.1 引言 334
8.2 实积分 335
8.2.1 黎曼和 335
8.2.2 梯形法则 336
8.2.3 误差的几何估计 337
8.3 复积分 339
8.3.1 复黎曼和 339
8.3.2 一个可视化技巧 341
8.3.3 一个有用的不等式 342
8.3.4 积分法则 342
8.4 复反演 343
8.4.1 一个圆弧 343
8.4.2 一般环路 344
8.4.3 环绕数 346
8.5 共轭映射 347
8.5.1 引言 347
8.5.2 用面积来解释 347
8.5.3 一般环路 349
8.6 幂函数 349
8.6.1 沿圆弧的积分 349
8.6.2 复反演作为极限情况 351
8.6.3 一般回路和形变定理 351
8.6.4 定理的进一步推广 353
8.6.5 留数 353
8.7 指数映射 355
8.8 基本定理 356
8.8.1 引言 356
8.8.2 一个例子 356
8.8.3 基本定理 357
8.8.4 积分作为原函数 359
8.8.5 对数作为积分 361
8.9 用参数作计算 362
8.10 柯西定理 363
8.10.1 一些预备知识 363
8.10.2 解释 364
8.11 一般的柯西定理 366
8.11.1 结果 366
8.11.2 解释 367
8.11.3 一个更简单的解释 368
8.11.4 回路积分的一般公式 369
8.12 习题 370
第9章 柯西公式及其应用 377
9.1 柯西公式 377
9.1.1 引言 377
9.1.2 第一种解释 377
9.1.3 高斯平均值定理 378
9.1.4 第二种解释和一般柯西公式 379
9.2 无穷可微性和泰勒级数 380
9.2.1 无穷可微性 380
9.2.2 泰勒级数 381
9.3 留数计算 383
9.3.1 以极点为中心的罗朗级数 383
9.3.2 计算留数的一个公式 384
9.3.3 对实积分的应用 385
9.3.4 用泰勒级数计算留数 387
9.3.5 在级数求和上的应用 388
9.4 环形域中的罗朗级数 390
9.4.1 一个例子 390
9.4.2 罗朗定理 391
9.5 习题 394
第10章 向量场:物理学与拓扑学 398
10.1 向量场 398
10.1.1 复函数作为向量场 398
10.1.2 物理向量场 399
10.1.3 流场和力场 400
10.1.4 源和汇 402
10.2 环绕数与向量场 403
10.2.1 奇点的指数 403
10.2.2 庞加莱怎样看指数 406
10.2.3 指数定理 407
10.3 闭曲面上的流 408
10.3.1 庞加莱-霍普夫定理的陈述 408
10.3.2 定义曲面上的指数 410
10.3.3 庞加莱-霍普夫定理的解释 411
10.4 习题 413
第11章 向量场与复积分 417
11.1 流量与功 417
11.1.1 流量 417
11.1.2 功 419
11.1.3 局部流量和局部功 420
11.1.4 散度和旋度的几何形式 422
11.1.5 零散度和零旋度向量场 423
11.2 从向量场看复积分 425
11.2.1 波利亚向量场 425
11.2.2 柯西定理 427
11.2.3 例子:面积作为流量 428
11.2.4 例子:环绕数作为流量 429
11.2.5 向量场的局部性态 430
11.2.6 柯西公式 431
11.2.7 正幂 432
11.2.8 负幂和多极子 433
11.2.9 无穷远处的多极子 435
11.2.10 罗朗级数作为多极子展开 435
11.3 复位势 436
11.3.1 引言 436
11.3.2 流函数 437
11.3.3 梯度场 439
11.3.4 势函数 440
11.3.5 复位势 441
11.3.6 例 444
11.4 习题 445
第12章 流与调和函数 448
12.1 调和对偶 448
12.1.1 对偶流 448
12.1.2 调和对偶 451
12.2 共形不变性 453
12.2.1 调和性的共形不变性 453
12.2.2 拉普拉斯算子的共形不变性 454
12.2.3 拉普拉斯算子的意义 456
12.3 一个强有力的计算工具 457
12.4 回顾复曲率 459
12.4.1 调和等势线的几何性质 459
12.4.2 调和等势线的曲率 460
12.4.3 关于复曲率的进一步计算 463
12.4.4 复曲率的其他几何性质 464
12.5 绕障碍物的流 466
12.5.1 引言 466
12.5.2 一个例子 466
12.5.3 镜像法 470
12.5.4 把一个流映为另一个流 476
12.6 黎曼映射定理的物理学 478
12.6.1 引言 478
12.6.2 外映射和绕障碍物的流 479
12.6.3 内映射和偶极子 481
12.6.4 内映射.涡旋和源 483
12.6.5 一个例子:圆盘的自同构 485
12.6.6 格林函数 487
12.7 狄里希莱问题 491
12.7.1 引言 491
12.7.2 施瓦茨的解释 492
12.7.3 圆盘的狄里希莱问题 494
12.7.4 诺依曼和波歇的解释 496
12.7.5 一般的格林公式 501
12.8 习题 504
参考文献 507
译后记... 514
还有1个属于同一作品或可能重复的条目,点击显示。
Visual Complex Analysis [图书] 豆瓣 谷歌图书
作者: Tristan Needham Oxford University Press, USA 1999 - 2
Now available in paperback, this successful radical approach to complex analysis replaces the standard calculational arguments with new geometric ones. With several hundred diagrams, and far fewer prerequisites than usual, this is the first visual intuitive introduction to complex analysis. Although designed for use by undergraduates in mathematics and science, the novelty of the approach will also interest professional mathematicians.
数据可视化之美 [图书] 豆瓣 Goodreads
Beautiful Visualization
作者: Julie Steele / Noah Iliinsky 译者: 祝洪凯 / 李妹芳 机械工业出版社 2011 - 6
《数据可视化之美》内容简介:可视化是数据描述的图形表示,旨在一目了然地揭示数据中的复杂信息。可视化的典型如纽约地铁图和人脑图。成功的可视化的美丽之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。
在《数据可视化之美》中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。在《数据可视化之美》中,你将:
通过简单的可视化实践探索讲故事的重要性。
了解颜色如何传达我们尚未充分意识到而大脑已经识别出的信息。
发现我们购买的书籍和我们的交际圈如何揭示内心的自我。
通过对民航交通的可视化探索识别航空旅行的混乱的一种方法。
揭秘研究人员如何调查未知问题,包括从最初的草图到发表的论文。
点击链接进入o'reilly之美系列:
《代码之美》
《项目管理之美》
《架构之美》
《团队之美》
《测试之美》
《数据之美》
《安全之美》
《数据可视化之美》
ggplot2:数据分析与图形艺术 [图书] 豆瓣
Ggplot2. elegant graphics for data analysis
作者: 哈德利·威克姆 (Hadley Wickham) 译者: 统计之都 西安交通大学出版社 2013 - 5
中译本序
每当我们看到一个新的软件,第一反应会是:为什么又要发明一个新软件?ggplot2是R世界里相对还比较年轻的一个包,在它之前,官方R已经有自己的基础图形系统(graphics包)和网格图形系统(grid包),并且Deepayan Sarkar也开发了lattice包,看起来R的世界对图形的支持已经足够强大了。那么我们不禁要问,为什么还要发明一套新的系统?
设计理念
打个比方,想想我们小时候怎样学中文的。最开始的时候我们要识字,不认识字就没法阅读和写作,但我们并不是一直按照一个个汉字学习的,而是通过句子和具体的场景故事学习的。为什么不在小学时背六年字典呢?那样可能认识所有的汉字。原因很简单,光有单字,我们不会说话,也无法阅读和写作。缺的是什么?答案是对文字的组织能力,或者说语法。
R的基础图形系统基本上是一个“纸笔模型”,即:一块画布摆在面前,你可以在这里画几个点,在那里画几条线,指哪儿画哪儿。后来lattice包的出现稍微改善了这种情况,你可以说,我要画散点图或直方图,并且按照某个分类变量给图中的元素上色,此时数据才在画图中扮演了一定的中心角色,我们不用去想具体这个点要用什么颜色(颜色会根据变量自动生成)。然而,lattice继承了R语言的一个糟糕特征,就是参数设置铺天盖地,足以让人窒息,光是一份xyplot()函数的帮助文档,恐怕就够我们消磨一天时间了,更重要的是,lattice仍然面向特定的统计图形,像基础图形系统一样,有直方图、箱线图、条形图等等,它没有一套可以让数据分析者说话的语法。
那么数据分析者是怎样说话的呢?他们从来不会说这条线用#FE09BE颜色,那个点用三角形状,他们只会说,把图中的线用数据中的职业类型变量上色,或图中点的形状对应性别变量。有时候他们画了一幅散点图,但马上他们发现这幅图太拥挤,最好是能具体看一下里面不同收入阶层的特征,所以他们会说,把这幅图拆成七幅小图,每幅图对应一个收入阶层。然后发现散点图的趋势不明显,最好加上回归直线,看看回归模型反映的趋势是什么,或者发现图中离群点太多,最好做一下对数变换,减少大数值对图形的主导性。
从始至终,数据分析者都在数据层面上思考问题,而不是拿着水彩笔和调色板在那里一笔一划作图,而计算机程序员则倾向于画点画线。Leland Wilkinson的著作在理论上改善了这种状况,他提出了一套图形语法,让我们在考虑如何构建一幅图形的时候不再陷在具体的图形元素里面,而是把图形拆分为一些互相独立并且可以自由组合的成分。这套语法提出来之后他自己也做了一套软件,但显然这套软件没有被广泛采用;幸运的是,Hadley Wickham在R语言中把这套想法巧妙地实现了。
为了说明这种语法的想法,我们考虑图形中的一个成分:坐标系。常见的坐标系有两种:笛卡尔坐标系和极坐标系。在语法中,它们属于一个成分,可自由拆卸替换。笛卡尔坐标系下的条形图实际上可以对应极坐标系下的饼图,因为条形图的高可以对应饼图的角度,本质上没什么区别。因此在ggplot2中,从一幅条形图过渡到饼图,只需要加极少量的代码,把坐标系换一下就可以了。如果我们用纸笔模型,则可以想象,这完全是不同的两幅图,一幅图里面要画的是矩形,另一幅图要画扇形。
更多的细节在本书中会介绍,这里我们只是简略说明用语法画图对用纸笔画图来说在思维上的优越性;前者是说话,后者是说字。
发展历程
ggplot2是Hadley在爱荷华州立大学博士期间的作品,也是他博士论文的主题之一,实际上ggplot2还有个前身ggplot,但后来废弃了,某种程度上这也是Hadley写软件的特征,熟悉他的人就知道这不是他第一个“2”版本的包了(还有reshape2)。带2的包和原来的包在语法上会有很大的改动,基本上不兼容。尽管如此,他的R代码风格在R社区可谓独树一帜,尤其是他的代码结构很好,可读性很高,ggplot2是R代码抽象的一个杰作。读者若感兴趣,可以在GitHub网站上浏览他的包:https://github.com/hadley。在用法方面,ggplot2也开创了一种奇特而绝妙的语法,那就是加号:一幅图形从背后的设计来说,是若干图形语法的叠加,从外在的代码来看,也是若干R对象的相加。这一点精妙尽管只是ggplot2系统的很小一部分,但我个人认为没有任何程序语言可比拟,它对作为泛型函数的加号的扩展只能用两个字形容:绝了。
至2013年2月26日,ggplot2的邮件列表(http://groups.google.com/group/ggplot2 )订阅成员已达3394人,邮件总数为15185封,已经成为一个丰富、活跃的用户社区。未来ggplot2的发展也将越来越依赖于用户的贡献,这也是很多开源软件最终的走向。
关于版本更新
原书面世之时,ggplot2的版本号是0.8.3,译者开始翻译此书时是0.9.0版本;该版本较之0.8.3,内部做了一些大改动。此后,ggplot2频繁升级,目前版本号是0.9.3,当然这也给本书的翻译过程带来了相当大的麻烦。因为译者不但要修正原书中大量过时的代码、重新画图,还要修正过时的理念,以及处理数次版本更新的影响。所幸,在翻译过程中,译者得到了本书审校殷腾飞博士、ggplot2开发者Hadley Wickham和Wistong Chang的大力帮助。
如果你是老用户,那么可能需要阅读下面的小节。之后ggplot2有过多次更新,尤其是0.9.0之后,ggplot2的绘图速度和帮助文档有了质的飞跃。关于0.9的更新,读者可以从https://github.com/downloads/hadley/ggplot2/guide-col.pdf下载一份细致的说明文档,但原文档比较长,而且有些内部更新问题我们也不一定需要了解,因此这里给一段概述。
ggplot2的帮助文档大大扩充了,过去头疼的问题之一就是一个函数里面不知道有哪些可能的参数,例如theme()函数,现在已经有了详细说明。
新增图例向导函数guide_legend()和guide_colorbar(),前者可以用来指导图例的排版,例如可以安排图例中元素排为n行m列;后者增强了连续变量图例的展示,例如当我们把颜色映射到一个连续变量上时,过去生成的图例是离散的,现在可以用这个函数生成连续颜色的图例(渐变色)。
新增几何对象函数geom_map()(让地图语法变得更简单),geom_raster()(更高效的geom_tile()),geom_dotplot()(一维点图,展示变量密度分布)和geom_violin()(小提琴,实为密度曲线)。
新增统计变换函数stat_summary2d()(在二维网格上计算数据密度),stat_summary_hex()(在六边形“蜂巢”上计算数据密度),stat_bindot()(一维点图密度),stat_ydensity()(密度曲线,用于小提琴图)。
facet_grid()支持X轴和Y轴其中一者可以有自由的刻度(根据数据范围而定),以往要么所有切片使用同样的坐标轴刻度,要么所有都自由。
geom_boxplot()开始支持画箱线图的凹槽(notch),就像R基础图形系统中的boxplot()函数。
新增函数ggmissing()用来展示缺失值的分布,ggorder()按照数据观察顺序先后画折线图,ggstructure()展示数据热图。
另外这次更新涉及到一些函数参数名称的变化,如果旧代码在这个版本中报错说有未使用的参数,那么用户需要再次查看帮助文档,确保输入的参数在函数中存在。在所有这些表面的更新背后,实际上ggplot2很大程度上被重写了,例如开始使用R自带的S3泛型函数设计,以及将过去ggplot2的功能继续模块化为一些独立的包,一个典型的例子就是标度部分的功能被抽象到scales包中,从数据映射到颜色、大小等外观属性可以由这个包直接完成。这种分拆也使得其他开发者可使用过去ggplot2内部的一些功能函数。
0.9.1版本主要解决了0.9.0版本中的一些漏洞。ggplot2在2012年9月4日发布了新的版本0.9.2,其中一些特性和更新有必要提及:
采用了全新的主题(theme)系统,opts()函数已被标记为“不推荐使用”(deprecated),将在未来版本中被取消,取而代之的是theme()函数,主题元素(theme element)由属性列表构成,支持继承,主题之间可以直接进行合并等操作。详情参见wiki页面:https://github.com/wch/ggplot2/wiki/New-theme-system 。
依赖于新的gtable包。 用来更方便地调整修改ggplot2图形中的图元,ggplotGrob()会返回一个gtable类,这个对象可以利用gtable包中提供的函数和接口进行操作。
所有“模板”类型的图形函数,比如plotmatrix(),ggorder()等等,已被标记为“不推荐使用”(deprecated),将在未来版本中取消。
在本书出版之际,ggplot2更新到了版本0.9.3,修复了0.9.2的一些漏洞,其主要更新包括
不再支持plotmatrix()函数。
geom_polygon()提速,比如世界地图的绘制快了12倍左右。
新增部分主题,比如theme_minimal(),theme_classic()。
本书的所有代码和图片都是针对新版本0.9.3的,在内容方面也根据版本更新对原文做了适当的增删填补,以满足读者的需求。
本书把影响正文阅读的彩图集中放在附录后面,读者可以随时翻阅。
致谢
在听说我们翻译完这本书之后,本书原著Hadley很高兴,给我们发邮件说:
I am excited and honoured to have my book translated to Chinese. ggplot2 has become far more popular than I ever imagined, and I'm excited that this translation will allow many more people to learn ggplot2. I'm very grateful that Yihui and his team of translators (Nan Xiao, Tao Gao, Yixuan Qiu, Weicheng Zhu, Taiyun Wei and Lanfeng Pan) made this possible.
One of the biggest improvements to ggplot2 since the book was first written is the ggplot2 mailing list. This is a very friendly environment where you can get help with your visualisations, and improve your own knowledge of ggplot2 by helping others solve their problems. I'd strongly encourage you to join the mailing list, even if you think your English is not very good -- we are very friendly people.
我们感谢这本书的译者,包括邱怡轩(第1~2章)、主伟呈(第3~4章)、肖楠(第5~6章)、高涛(第7~8章)、潘岚锋(第9章)、魏太云(第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作)。所有译者均来自于统计之都(http://cos.name )。
爱荷华州立大学的殷腾飞博士、中国人民大学统计学院的孟生旺教授、浙江大学的张政同学通读了译稿,提出了很多有用的建议,殷腾飞博士还提供了大多数新版本中的解决方案,并担任本书的审校。肖凯老师和余光创博士分别对第1~4章、第8~10章以及附录提出了很多修改意见,此外,中国人民大学的陈妍、李晓矛、谢漫锜三位同学、中国再保险公司的李皞先生、百度公司的韩帅先生、eBay公司的陈丽云女士、Mango Solutions公司的李舰先生、京东商城的刘思喆先生、首钢总公司的邓一硕先生、新华社的陈堰平先生在此书的翻译过程中也曾提过不少宝贵的建议,在此一并表示感谢。
为了更好地服务社区,我们还建立了翻译主页:https://github.com/cosname/ggplot2-translation ,读者可以在这里得到最新的勘误和书中的代码,也可以随时提出任何问题。
谢益辉
2013年2月26日
Beautiful Evidence [图书] 豆瓣 Goodreads
Beautiful Evidence
作者: Edward R Tufte Graphics Pr 2006 - 1
Science and art have in common intense seeing, the wide-eyed observing that generates visual information.
is about how seeing turns into showing, how data and evidence turn into explanation. The book identifies excellent and effective methods for showing nearly every kind of information, suggests many new designs (including sparklines), and provides analytical tools for assessing the credibility of evidence presentations (which are seen from both sides: how to produce and how to consume presentations). For alert consumers of presentations, there are chapters on diagnosing evidence corruption and PowerPoint pitches.
concludes with two chapters that leave the world of pixel and paper flatland representations - and move onto seeing and thinking in space land, the real-land of three-space and time.
防灾,原来如此! [图书] 豆瓣
作者: 赵慧 主编 东方出版社 2020 - 7
【内容简介】
这是一部图文并茂、生动实用的灾害防治科普读物,也是一本简明安全应急指南,旨在为公众提供灾前预防、灾害求生、灾后重建的相关方案,同时帮助人们提高防灾意识,增加防灾应急的知识与技能。人生不易,愿每个人都有自救互救的知识与底气。
【编辑推荐】
☆权威审订|多领域一线专家、培训师全面参与审订
☆科学实用|树立科学防灾意识,提供可靠支持方案
☆简明易读|多级索引,匆忙、浮躁时也能畅快阅读
☆装帧精美|百余幅清新插画,精巧开本,便于携带
从SARS到新型冠状病毒肺炎,
从地震、台风、洪水到火灾、爆炸、踩踏事故,
数据汇总令人变得麻木,
可每个个体都是鲜活的生命。
为了下一次不再措手不及,
为了让逝去的生命不只是数字,
我们必须从现在做好准备!
灾害前如何未雨绸缪,做好防灾准备?
灾害发生时如何保护生命安全,积极逃生?
灾后如何获得专业援助,重启正常生活?
一本事无巨细的安全应急知识读本,
一堂面向普通人的灾害求生智慧课,
一册在手,防灾,原来如此简单!
Visual Explanations [图书] 豆瓣 Goodreads
Visual Explanations: Images and Quantities, Evidence and Narrative
作者: Edward R. Tufte Graphics Press 1997 - 2
Visual Explanations: Images and Quantities, Evidence and Narrative is about pictures of verbs, the representation of mechanism and motion, process and dynamics, causes and effects, explanation and narrative. Practical applications and examples include statistical graphics, charts for making important decisions in engineering and medicine, technical manuals, diagrams, design of computer interfaces and websites and on-line manuals, animations and scientific visualizations, techniques for talks, and design strategies for enhancing the rate of information transfer in print, presentations, and computer screens. The use of visual evidence in deciding to launch the space shuttle Challenger is discussed in careful detail. Video snapshots show redesigns of a supercomputer animation of a thunderstorm. The book is designed and printed to the highest standards, with luscious color throughout and four built-in flaps for showing motion and before/after effects.
在你身边,为你设计 [图书] 豆瓣
6.3 (9 个评分) 作者: 腾讯公司用户研究与体验设计部 电子工业出版社 2013 - 1
设计属于所有人,也意在为所有人使用,这既是设计的价值,也是设计的责任。本书内容包括:设计理念、设计方法、用户研究、体验设计、设计流程和工具,以及团队成长与管理等方面的知识与经验分享。
Data Feminism [图书] 豆瓣 Goodreads
作者: Catherine D'Ignazio / Lauren F. Klein The MIT Press 2020 - 3
A new way of thinking about data science and data ethics that is informed by the ideas of intersectional feminism.
Today, data science is a form of power. It has been used to expose injustice, improve health outcomes, and topple governments. But it has also been used to discriminate, police, and surveil. This potential for good, on the one hand, and harm, on the other, makes it essential to ask: Data science by whom? Data science for whom? Data science with whose interests in mind? The narratives around big data and data science are overwhelmingly white, male, and techno-heroic. In Data Feminism, Catherine D'Ignazio and Lauren Klein present a new way of thinking about data science and data ethics―one that is informed by intersectional feminist thought.
Illustrating data feminism in action, D'Ignazio and Klein show how challenges to the male/female binary can help challenge other hierarchical (and empirically wrong) classification systems. They explain how, for example, an understanding of emotion can expand our ideas about effective data visualization, and how the concept of invisible labor can expose the significant human efforts required by our automated systems. And they show why the data never, ever “speak for themselves.”
Data Feminism offers strategies for data scientists seeking to learn how feminism can help them work toward justice, and for feminists who want to focus their efforts on the growing field of data science. But Data Feminism is about much more than gender. It is about power, about who has it and who doesn't, and about how those differentials of power can be challenged and changed.
代码本色:用编程模拟自然系统 [图书] 豆瓣
The Nature of Code: Simulating Natural Systems with Processing
9.6 (5 个评分) 作者: Daniel Shiffman 译者: 周晗彬 人民邮电出版社 2014 - 10
本书介绍了用计算机模拟自然系统涉及的编程策略与技术,涵盖了基本的数学和物理概念,以及可视化地展示模拟结果所需的高级算法。读者将从构建基本的物理引擎开始,一步一步地学习如何创建智能移动的物体和复杂的系统,为进一步探索生成设计奠定基础。相关的知识点包括力、三角、分形、细胞自动机、自组织和遗传算法。本书的示例使用基于Java的开源语言及开发环境Processing编写。本书网站http://www.natureofcode.com)上的示例是在浏览器中通过Processing的JavaScript模式运行的。
作为纽约大学Tisch艺术学院Nature of Code课程主讲老师,Daniel集合了多年开发和教学经验,希望借由此书让大家真正了解如何用代码模拟自然现象。
最简单的图形与最复杂的信息 [图书] 豆瓣
The Wall Street Journal Guide to Information Graphics
作者: [美]黄慧敏(Dona M.Wong) 译者: 白颜鹏 浙江人民出版社 2013 - 11
[内容简介]
★在当今这个数据驱动、信息大爆炸的时代,我们需要懂得如何利用图形语言清晰、高效地表达自己。可是,我们应该如何选择反映信息的最佳图形?如何利用黑白两色令图形“多彩”?如何让“相貌平平”的图表升级为“才华出众”的图表?如何建立自己的视觉思维,以找到最有力的方式在最短的时间内打动决策者?
★在本书中,黄慧敏将数据分析和图形制作巧妙地结合在一起,清晰、有效地告诉我们如何将纷繁复杂的图形和陈述报告变得既简单又有表现力,实操性很强,且易于理解。
[编辑推荐]
★这是《华尔街日报》与作者第一次公开这种专业秘诀,出版后破天荒打进美国亚马逊金融投资类第一名、《纽约时报》商业类排行榜第九名。
★作者是数据可视化权威爱德华•塔夫特(Edward Tufte)的学生,拥有耶鲁大学美术硕士学位,处理财金图表经验逾20年。
★麦肯锡公司形象化沟通主管、纽约联邦储备银行执行副总裁、穆迪经济学家网创始人兼首席经济学家、牛津大学赛德商学院长、《华尔街日报》前总编辑等,对于黄慧敏非凡的资料解释能力、视觉呈现能力,都赞不绝口。
★湛庐文化出品。
鲜活的数据 [图书] 豆瓣
作者: [美] Nathan Yau 译者: 向怡宁 人民邮电出版社 2012 - 10
在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。
数据之美 [图书] 豆瓣
Beautiful Data: The Stories Behind Elegant Data Solutions
作者: Toby Segaran / Jeff Hammerbacher 译者: 祝洪凯 / 李妹芳 机械工业出版社 2010 - 10
“数据被证实好比下一代计算机应用的‘因特尔内核’。在本书中,各业界领袖描述了他们的项目如何通过新的方式来驾驭数据的力量。对于任何对未来关于数据和问题解决感兴趣的读者来说,本书是必读的佳作。”
——Tim O’Reilly, O’Reilly Media公司创始人兼CEO
探索数据的范围可以多么广泛,其工作可以多么美丽!通过这部个人故事集合,在这个领域的39个最佳数据实践者阐释了他们如何为各种项目开发简单优雅的解决方案,包括从火星着陆探测器到Radiohead视频的制作……在本书中,你将:
探索海量在线数据集时面临的内在机遇和挑战
学习如何使用地图和数据“混搭”方式对都市犯罪趋势进行可视化
发现“众包”和透明如何改进药物研究现状
理解当新的数据和之前存在的数据交叠时如何向用户发送警告
学习处理DNA数据的大规模基础设施
登录用户可看到来自其它网站的搜索结果。