Rachel Warren — 作者 (2)
高性能Spark [图书] 豆瓣
作者: Holden Karau / Rachel Warren 译者: 夏锐 / 陈志鹏 出版社: 中国电力出版社 2022 - 1
通过本书,你可以了解到:Spark SQL的新接口如何为SQL的RDD数据结构提升性能。Spark Core与Spark SQL中数据join的不同选择方式。充分利用标准RDD转换的技术。如何解决Spark中键值范式的性能问题。不借助Scala或其他JVM语言来编写高性能的Spark代码。采用改进建议后,如何来测试其功能及性能情况。使用Spark MLlib和Spark ML机器学习库。Spark的流处理组件、外部的社区扩展包。