大数据
Hadoop权威指南(第3版) 豆瓣
Hadoop: The Definitive Guide,3rd Edition
作者: [美] Tom White 译者: 华东师范大学数据科学与工程学院 清华大学出版社 2015 - 1
准备好释放数据的强大潜能了吗?借助于这本《Hadoop权威指南》,你将学习如何使用ApacheHadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。
《Hadoop权威指南(第3版 修订版)》通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括新增的MapReduceAPI,以及MapReduce2及其灵活性更强的执行模型(YARN)。
Kafka权威指南 豆瓣
Kafka: The Definitive Guide
作者: Neha Narkhede / Gwen Shapira 译者: 薛命灯 人民邮电出版社 2017
每个应用程序都会产生数据,包括日志消息、度量指标、用户活动记录、响应消息等。如何移动数据,几乎变得与数据本身一样重要。如果你是架构师、开发者或者产品工程师,同时也是Apache Kafka新手,那么这本实践指南将会帮助你成为流式平台上处理实时数据的专家。
本书由出身于LinkedIn的Kafka核心作者和一线技术人员共同执笔,详细介绍了如何部署Kafka集群、开发可靠的基于事件驱动的微服务,以及基于Kafka平台构建可伸缩的流式应用程序。通过详尽示例,你将会了解到Kafka的设计原则、可靠性保证、关键API,以及复制协议、控制器和存储层等架构细节。
● 了解发布和订阅消息模型以及该模型如何被应用在大数据生态系统中
● 学习使用Kafka生产者和消费者来生成消息和读取消息
● 了解Kafka保证可靠性数据传递的模式和场景需求
● 使用Kafka构建数据管道和应用程序的最佳实践
● 在生产环境中管理Kafka,包括监控、调优和维护
● 了解Kafka的关键度量指标
● 探索Kafka如何成为流式处理利器
数据密集型应用系统设计 豆瓣
Designing Data-Intensive Applications
9.6 (18 个评分) 作者: Martin Kleppmann 译者: 赵军平 / 李三平 中国电力出版社 2018 - 9
全书分为三大部分:
第一部分,主要讨论有关增强数据密集型应用系统所需的若干基本原则。首先开篇第1章即瞄准目标:可靠性、可扩展性与可维护性,如何认识这些问题以及如何达成目标。第2章我们比较了多种不同的数据模型和查询语言,讨论各自的适用场景。接下来第3章主要针对存储引擎,即数据库是如何安排磁盘结构从而提高检索效率。第4章转向数据编码(序列化)方面,包括常见模式的演化历程。
第二部分,我们将从单机的数据存储转向跨机器的分布式系统,这是扩展性的重要一步,但随之而来的是各种挑战。所以将依次讨论数据远程复制(第5章)、数据分区(第6章)以及事务(第7章)。接下来的第8章包括分布式系统的更多细节,以及分布式环境如何达成一致性与共识(第9章)。
第三部分,主要针对产生派生数据的系统,所谓派生数据主要指在异构系统中,如果无法用一个数据源来解决所有问题,那么一种自然的方式就是集成多个不同的数据库、缓存模块以及索引模块等。首先第10章以批处理开始来处理派生数据,紧接着第11章采用流式处理。第12章总结之前介绍的多种技术,并分析讨论未来构建可靠、可扩展和可维护应用系统可能的新方向或方法。
数据化决策 豆瓣
How to Measure Anything: Finding the Value of Intangibles in Business
作者: 道格拉斯•W•哈伯德 译者: 邓洪涛 世界图书出版公司 2013 - 9
你还在依赖直觉和经验艰难地作出决策吗?这本书让你定量决策:
可口可乐动用2 000名调研员,对19万人进行口味测试后,如何作出最终决策?
如何衡量并未开口抱怨的顾客对服务或产品质量的不满意度?
如何通过数学公式找到最适合你的另一半?
数据无孔不入,大数据时代,谁掌握了数据,谁就能把握成功。“一切皆可量化”,道格拉斯这个大胆的宣言是解决诸多生活和商业问题的关键所在。
无论你的问题看起来多么不可量化,如健康、幸福感、顾客满意度、IT安全、投资风险、品牌价值、组织灵活性等,在本书中都可以找到量化的办法。作者在本书中:
专注于量化不确定性、风险和数据价值;
提供了令人拍案惊奇的测算无形之物的简便方法,让你仅仅基于已知数据就能准确决策;
展示了丰富而精彩的量化案例,让身边的数据唾手可得。
本书兼具实用性、可读性与趣味性,甚至让反感数据的人也能发现它的亲切。