技术
算法(第4版) 豆瓣
Algorithms (4/e)
9.5 (25 个评分) 作者: [美] Robert Sedgewick / [美] Kevin Wayne 译者: 谢路云 人民邮电出版社 2012 - 10
本书全面讲述算法和数据结构的必备知识,具有以下几大特色。
 算法领域的经典参考书
Sedgewick畅销著作的最新版,反映了经过几十年演化而成的算法核心知识体系
 内容全面
全面论述排序、搜索、图处理和字符串处理的算法和数据结构,涵盖每位程序员应知应会的50种算法
 全新修订的代码
全新的Java实现代码,采用模块化的编程风格,所有代码均可供读者使用
 与实际应用相结合
在重要的科学、工程和商业应用环境下探讨算法,给出了算法的实际代码,而非同类著作常用的伪代码
 富于智力趣味性
简明扼要的内容,用丰富的视觉元素展示的示例,精心设计的代码,详尽的历史和科学背景知识,各种难度的练习,这一切都将使读者手不释卷
 科学的方法
用合适的数学模型精确地讨论算法性能,这些模型是在真实环境中得到验证的
 与网络相结合
配套网站algs4.cs.princeton.edu提供了本书内容的摘要及相关的代码、测试数据、编程练习、教学课件等资源
程序员面试金典(第5版) 豆瓣
Cracking the coding interview:150 programming questions and solutions,fifth edition
作者: [美] Gayle Laakmann McDowell 译者: 李琳骁 / 漆犇 人民邮电出版社 2013 - 11
本书是原谷歌资深面试官的经验之作,层层紧扣程序员面试的每一个环节,全面而详尽地介绍了程序员应当如何应对面试,才能在面试中脱颖而出。第1~7 章主要涉及面试流程解析、面试官的幕后决策及可能提出的问题、面试前的准备工作、对面试结果的处理等内容;第8~9 章从数据结构、概念与算法、知识类问题和附加面试题4 个方面,为读者呈现了出自微软、苹果、谷歌等多家知名公司的150 道编程面试题,并针对每一道面试题目,分别给出了详细的解决方案。
本书适合程序开发和设计人员阅读。
七周七数据库 豆瓣
Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement
作者: [美]Eric Redmond 译者: 王海鹏 / 田思源 人民邮电出版社 2013 - 5
如今,我们要面对和使用的数据正在变得越来越庞大和复杂。如果说数据是新的石油。那么数据库就是油田、炼油厂、钻井和油泵。作为一名现代的软件开发者,我们需要了解数据管理的新领域,既包括rdbms,也包括nosql。
《七周七数据库》遵循《七周七语言》的写作风格和体例,带领你学习和了解当令最热门的开源数据库。在简单的介绍之后,本书分章介绍了7种数据库。这些数据库分别属于5种不同的数据库风格,但每种数据库都有自己保存数据和看待世界的方式。它们依次是postgresql、riak、apache hbase、mongodb、apache couchdb、neo4j和redis。本书将深入每一种数据库,介绍它们的优势和不足,以及如何选取一种最符合你的应用需求的数据库。
《七周七数据库》适合数据库架构师、数据库管理员,以及想要了解和学习各种nosql数据库技术的程序员阅读。本书将帮助读者了解、选择和应用这些数据库,从而更好地发挥日益增长的大数据的能力。
《七周七数据库》适用于数据库架构师、想要学习nosql数据库技术的程序员、数据库管理员。
图解HTTP 豆瓣 Goodreads
HTTPの教科書
8.0 (47 个评分) 作者: [日] 上野宣 译者: 于均良 人民邮电出版社 2014 - 4
图解HTTP》对互联网基盘——HTTP协议进行了全面系统的介绍。作者由HTTP协议的发展历史娓娓道来,严谨细致地剖析了HTTP协议的结构,列举诸多常见通信场景及实战案例,**后延伸到Web安全、**新技术动向等方面。《图解HTTP》的特色为在讲解的同时,辅以大量生动形象的通信图例,更好地帮助读者深刻理解HTTP通信过程中客户端与服务器之间的交互情况。读者可通过《图解HTTP》快速了解并掌握HTTP协议的基础,前端工程师分析抓包数据,后端工程师实现REST API、实现自己的HTTP服务器等过程中所需的HTTP相关知识点本书均有介绍。
《图解HTTP》适合Web开发工程师,以及对HTTP协议感兴趣的各层次读者。
Flask Web开发:基于Python的Web应用开发实战 豆瓣
8.8 (12 个评分) 作者: [美] Miguel Grinberg 译者: 安道 人民邮电出版社 2014
本书不仅适合初级Web开发人员学习阅读,更是Python程序员用来学习高级Web开发技术的优秀参考书。
• 学习Flask应用的基本结构,编写示例应用;
• 使用必备的组件,包括模板、数据库、Web表单和电子邮件支持;
• 使用包和模块构建可伸缩的大型应用;
• 实现用户认证、角色和个人资料;
• 在博客网站中重用模板、分页显示列表以及使用富文本;
• 使用基于Flask的REST式API,在智能手机、平板电脑和其他第三方客户端上实现可用功能;
• 学习运行单元测试以及提升性能;
• 将Web应用部署到生产服务器。
SQL学习指南(第2版 修订版) 豆瓣
作者: 博利厄 (Alan Beaulieu) 译者: 张伟超 / 林青松 人民邮电出版社 2015 - 2
《SQL学习指南(第2版 修订版)》全面系统地介绍了SQL语言各方面的基础知识以及一些高级特性,包括SQL数据语言、SQL方案语言、数据集操作、子查询以及内建函数与条件逻辑等内容。书中每个章节讲述一个相对独立的主题,并提供了相关示例和练习。《SQL学习指南(第2版 修订版)》内容以SQL92标准为蓝本,涵盖了市场上常用数据库的最新版本(MySQL 6.0、Oracle 11g及Microsoft SQL Server 2008)。
《SQL学习指南(第2版 修订版)》适合数据库应用开发者、数据库管理员和高级用户阅读。针对开发基于数据库的应用程序,以及日常的数据库系统管理,《SQL学习指南(第2版 修订版)》都展现了大量经过实践检验的方法和技巧。读者可以通过对《SQL学习指南(第2版 修订版)》循序渐进地学习快速掌握SQL语言,也可以在实际工作中遇到问题时直接翻阅《SQL学习指南(第2版 修订版)》中的相关章节以获取解决方案。
PostgreSQL 数据库内核分析 豆瓣
作者: 彭智勇 / 彭煜玮 机械工业出版社华章公司 2012 - 1
PostgreSQL是目前广泛应用的开源数据库管理系统。本书从PostgreSQL数据库的源代码入手,深入分析了该数据库管理系统的底层实现细节,揭示了数据库运行的基本原理。本书的主要内容包括:PostgreSQL数据库的体系结构、 存储管理、索引机制、查询编译、查询执行、并发控制机制以及安全等。每个主题都引用了大量的数据结构、图表等进行说明,使读者对实现过程和机理一目了然。
本书适合从事数据库领域相关研究的技术人员、高等院校相关专业高年级本科生或研究生阅读,有助于读者进行数据库的高级开发、基于PostgreSQL定制满足需求的数据库系统,或者在数据库内核中实现并验证数据库新技术。
编程之美 豆瓣 Goodreads
7.8 (17 个评分) 作者: 《编程之美》小组 编 电子工业出版社 2008 - 3
这本书收集了约60道算法和程序设计题目,这些题目大部分在近年的笔试、面试中出现过,或者是被微软员工热烈讨论过。作者试图从书中各种有趣的问题出发,引导读者发现问题,分析问题,解决问题,寻找更优的解法。本书的内容分为下面几个部分:
(1)游戏之乐:从游戏和其他有趣问题出发,化繁为简,分析总结。
(2)数字之魅:编程的过程实际上就是和数字及字符打交道的过程。这一部分收集了一些好玩的对数字进行处理的题目。
(3)结构之法:汇集了常见的对字符串、链表、队列,以及树等进行操作的题目。
(4)数学之趣:列举了一些不需要写具体程序的数学问题,锻炼读者的抽象思维能力。
书中绝大部分题目都提供了详细的解说。 每道题目后面还有一至两道扩展问题,供读者进一步钻研。
书中还讲述了面试的各种小故事,告诉读者微软需要什么样的技术人才,重视什么样的能力,如何甄别人才。回答读者关于IT业面试,招聘,职业发展的疑问。这本书的很多题目会出现在IT 行业的各种笔试、面试中,但这本书更深层的意义在于引导读者思考,和读者共享思考之乐,编程之美。
推荐系统 豆瓣
Recommender systems:An introduction
作者: [奥地利] Dietmar Jannach / Markus Zanker 译者: 蒋 凡 人民邮电出版社 2013 - 6
编辑推荐:
通过对本书的学习,读者不仅可以全面系统地了解该领域的基础原理,还能试验如何搭建一套真正的推荐系统。
—— 百度主任架构师、百度技术委员会主席 廖若雪
本书比较全面地介绍了推荐系统涉及的相关知识点,很适合对于推荐系统感兴趣的相关人员作为入门教程,目前能够系统全面介绍相关技术的中文书籍还显得匮乏,相信这本译著对于缓解这种情况大有裨益。
——新浪微博数据挖掘技术专家 张俊林
本书不但介绍了比较成熟的经典算法,还介绍了最近几年的一些新进展,并辅之以实际应用的案例介绍。希望看到越来越多的朋友加入到推荐引擎的研究和应用中来!
——百分点信息科技有限公司首席运营官兼技术副总裁 张韶峰
由蒋凡执笔翻译的这本《推荐系统》是一本从基础介绍推荐引擎的难得的好书,给人启迪良多。愿越来越多的互联网爱好者认真阅读本书,走在互联网发展大潮的前沿,成为下一代互联网产品真正需要的人才。
——人民搜索商务搜索部总监 常兴龙
读者评价:
这是迄今为止市面上所有讲推荐系统的书中最全面、最实用的一本入门指南。如果你是教这门课的大学老师,万万不能错过这本“推荐系统大全”。尤其值得称道的是,这本书广泛涵盖了不同类型的推荐系统,并对它们逐一进行了鞭辟入里、细致入微的剖析。虽然这本书定位于初中级读者,但是我认为即使是经验丰富的专业人员,也会在其中发现新鲜有趣的内容。
——Robin Burke, 芝加哥德保罗大学教授
本书涵盖了推荐系统领域的全部知识,并为应对未来新的挑战提供了前瞻性建议。书中全面解释了一系列生成推荐的经典算法和方法,概述了源自社交计算和语义网的新手段对推荐系统的作用。希望这本书能够点燃你的激情,释放你的创造力和进取精神,把推荐系统的研究与应用推向新的高度。
——Joseph A. Konstan, 美国明尼苏达大学教授
内容简介:
本书全面阐述了开发最先进推荐系统的方法,其中呈现了许多经典算法,并讨论了如何衡量推荐系统的有效性。书中内容分为基本概念和最新进展两部分:前者涉及协同推荐、基于内容的推荐、基于知识的推荐、混合推荐方法,推荐系统的解释、评估推荐系统和实例分析;后者包括针对推荐系统的攻击、在线消费决策、推荐系统和下一代互联网以及普适环境中的推荐。此外,本书还包含大量的图、表和示例,有助于读者理解和把握相关知识。
本书适用于从事搜索引擎、推荐算法、数据挖掘等研发工作的专业人员以及对推荐系统感兴趣的读者。
Web渗透测试 豆瓣
Web Penetration Testing with Kali Linux
作者: [美] Joseph Muniz / [美] Aamir Lakhani 译者: 涵父 人民邮电出版社 2014 - 8
Kali Linux是专业的渗透测试和安全审计工具,是世界上最流行的开源渗透工具包BackTrack的继任者。本书将教会读者怎样像真实的攻击者一样思考,以及理解他们如何利用系统和发现漏洞。
现实当中,就算你在极为安全的环境中开发Web应用,而且也有入侵检测系统和防火墙的保护,但要上线总得有一个对外开放的端口吧。这些端口在潜在攻击者眼里,就如同敞开的大门。因此,Web应用测试中绝不能缺少渗透测试这一环。本书是市面上第一本全面深入讲解Kali Linux工具包的专著,它注重实战、通俗易懂,强调换位思考,主张积极防御,是学习Kali Linux与渗透测试的必读之作。
本书作者均为国际知名的安全专家,其中Aamir Lakhani曾被《福布斯》杂志直言不讳地称为“间谍、超级英雄”,也是他们推荐的最值得关注的“46位美国联邦技术专家”之一。Joseph Muniz同样长期从事安全工作,现任思科公司系统安全工程师,并经常为《渗透测试》杂志撰稿。
本书适合所有渗透测试及对Web应用安全感兴趣的读者,特别是想学习使用Kali Linux的人阅读参考。有BackTrack经验的读者也可以通过本书了解这两代工具包的差异,学习下一代渗透测试工具和技术。
本书内容
进行安全漏洞侦察,收集目标信息
发现服务器安全漏洞,利用其获得高级访问权限
使用Web应用协议利用基于客户端的系统
使用SQL和跨站脚本(XSS)攻击
通过会话劫持技术窃取身份认证
加强系统防护,阻止其他攻击者利用系统
生成渗透测试报告
学习专业渗透测试人员的技巧,了解行业内幕
Python Web开发实战 豆瓣
作者: 董伟明 电子工业出版社 2016 - 9
这本书涵盖了Web开发的方方面面,可以分为如下部分:
1. 使用最新的Flask 0.11进行Web开发,学习Jinja2、Flask-Script、Flask-Migrate、Flask-Security、Flask-Assets等8种常用扩展,帮助读者理解Flask 的 优秀设计(上下文、BluePrint等),最后利用Mako、Flask_mako、SQLAlchemy、Pillow等技术实现一个豆瓣一个真实的服务。
2. 阐述笔者对REST的理解,并提出一些设计API的注意事项,最后通过jQuery和fetch实现使用Ajax的例子,让读者了解如何让前后端通信。
3. 对Python应用服务器,Web服务器、缓存系统、键值对数据库等技术的选型和使用方法,最后演示大型网站架构及其重要组件的用意。
4. 使用Fabric、SaltStack、Ansible、Supervisor、Graphite等做系统管理,并演示一个通过最新的Sentry 8演示如何收集应用错误信息。
5. 测试和持续集成,最后使用最新的Buildbot 0.9实现一个Github项目的持续集成。
6. 深入RabbitMQ和Celery的原理和使用方法,最后分享笔者使用的进阶实践。
7. 服务化及豆瓣服务化实践。
8. 详细讲解豆瓣工程师都在用的DPark,包含安装、环境配置、使用和框架化分析uv&pv,接着将展示几个笔者实际工作中的数据报表需求,并讲解如何用Pandas做数据可视化。
9. 深入IPython和Jupyter Notebook这两个工具,并分享在豆瓣对应的实践。
10. 从获取Linux服务器的相关情况、性能测试、分析Python程序性能瓶颈三个方面展示对应的工具及使用方法。
11. 以抓取微信公众号文章为主线,分别使用多线程、多进程、Gevent、Future和asyncio这5种编程方式完成不同阶段的爬取任务,也深入地分析在它们之间如何选择。
12. Python进阶和Web项目经验。
封底推荐语
伟明把他个人多年 Web 开发的经验,以及豆瓣十年来数百名优秀工程师在 Web 开发上最佳实践的积累,凝聚在了《Python Web 开发实战》这本书里,多维度、全面地介绍了 Python Web 开发涉及的各种技术。我向所有有兴趣使用 Python 做 Web 开发的开发者们,强烈推荐此书。
——洪强宁,爱因互动CTO,前豆瓣首席架构师,前宜信大数据创新中心首席架构师
感谢伟明把豆瓣的一些工程实践进行了整理和总结,这是本书最宝贵的一点,库谁都会用,但在什么场景使用,在生产环境中这个库的表现到底如何,是这本书的一个精华,期望将来还可以看到越来越多这样的图书,祝此书大卖。
——清风,SAY CEO,前豆瓣技术总监。
伟明将自身在 Web 领域所有方面的经验提炼后整理成书,本质上是将几十个关联产品的官方文档,结合具体工程经验进行了梳理,给出了领域问题最佳方案的关键思考点和自己的答案,而更加可贵的是,给出了这些思考点的来源,以及形成过程,即给出了解决各种 Web 领域问题的思维模式。
——Zoom.Quiet(大妈),优视眼动科技 CTO,Python 中文社区创始人之一和管理员
阅读本书,我最大的感受就是:全和新。本书的内容涉及了Web框架、Ajax的前后端交互、测试、数据库、数据分析、服务化、部署、系统管理、常用工具等内容,有点百科全书的意味。另外,书中讲的许多东西都是现在正在流行的技术或工具,像Flask、Celery、Jupyter、Supervisor、SaltStack、Pandas等。
——李迎辉,Python开源资深行者,Python-CN邮件列表创建人,UliPad和Uliweb作者
本书由Python开发开始,循序渐进,把网站工程的全貌展现在读者的眼前,是了解Web工程从开发到上线完整流程的绝佳参考书籍。
——邢犇(CNBorn), 前豆瓣东西技术负责人
很多刚进入Python世界的人,伟明的这本书提供了一个非常好的“知识地图”,书中涉及了Python Web开发的方方面面。
——胡阳(the5fire),手机搜狐网,任资深开发工程师
这本书从开发环境的搭建,Web 框架的使用,到最后的持续集成和 Python 的进阶用法,无一不是他多年的实际工程经验总结,十分宝贵。
——姚钢强(acmerfight),知乎工程师
这本书非常全面地介绍了使用 Python 进行 Web 开发的方方面面,既有 Web 框架、缓存、消息队列、并发处理的场景介绍和技术选型,又有开发流程、质量保证的丰富实战经验。
——蔡斌(VeryCB),DeepDevelop工程师,前豆瓣条目组技术负责人
整本书都是作者对实际Web项目中大量实战经验的总结,绝非纸上谈兵。相信通过阅读该书可以帮助开发者规避掉大量项目中的“坑”,构建出更高性能、更稳定的Web项目。
——Spawnris, 腾讯工程师
2016年10月25日 已读
解决很多 flask 使用中的疑问,学习了;缺点是知识点比较琐碎,适合当手册遇到问题可以翻一翻
技术
深入理解 Flask 豆瓣
Mastering Flask
作者: [美]Jack Stouffer 译者: 苏丹 电子工业出版社 2016 - 7
Flask 是一种具有平缓学习曲线和庞大社区支持的微框架,利用它可以构建大规模的web应用。学习上手Flask非常轻松,但要深入理解却并不容易。
本书从一个简单的Flask应用开始,通过解决若干实战中的问题,对一系列进阶的话题进行了探讨。书中使用MVC(模型-视图-控制器)架构对示例应用进行了转化重构,以演示如何正确地组织应用代码结构。有了可扩展性强的应用结构之后,接下来的章节使用Flask扩展为应用提供了额外的功能,包括用户登录和注册、NoSQL查询、REST API、一套后台管理界面,以及其他特性。然后,你会学到如何使用单元测试,保障代码持续按照正确的方式工作,避免极具风险的猜测式编程。本书最后会讨论可用于部署Flask应用的诸多不同平台,以及你必须考虑的,每个平台的优劣利弊。
增长黑客 豆瓣
7.5 (16 个评分) 作者: 范冰 电子工业出版社 2015 - 7
“增长黑客”这一概念近年来兴起于美国互联网创业圈,最早是由互联网创业者Sean Ellis提出。增长黑客是介于技术和市场之间的新型团队角色,主要依靠技术和数据的力量来达成各种营销目标,而非传统意义上靠砸钱来获取用户的市场推广角色。他们能从单线思维者时常忽略的角度和难以企及的高度通盘考虑影响产品发展的因素,提出基于产品本身的改造和开发策略,以切实的依据、低廉的成本、可控的风险来达成用户增长、活跃度上升、收入额增加等商业目的。简单来说,就是低成本甚至零成本地用“技术”来让产品获得有效增长。
Python高手之路 豆瓣
The Hacker's Guide to Python
作者: Julien Danjou 译者: 王飞龙 人民邮电出版社 2015 - 5
这不是一本常规意义上Python的入门书。这本书中没有Python关键字和for循环的使用,也没有细致入微的标准库介绍,而是完全从实战的角度出发,对构建一个完整的Python应用所需掌握的知识进行了系统而完整的介绍。更为难得的是,本书的作者是开源项目OpenStack的PTL(项目技术负责人)之一,因此本书结合了Python在OpenStack中的应用进行讲解,非常具有实战指导意义。
《Python高手之路》从如何开始一个新的项目讲起,首先是整个项目的结构设计,对模块和库的管理,如何编写文档,进而讲到如何分发,以及如何通过虚拟环境对项目进行测试。此外,《Python高手之路》还涉及了很多高级主题,如性能优化、插件化结构的设计与架构、Python 3的支持策略等。
2016年4月26日 已读
看完也没成为高手。。。。。
技术
七周七语言 豆瓣
Seven Languages in Seven Weeks: A Pragmatic Guide to Learning Programming Languages
8.8 (19 个评分) 作者: [美] Bruce A. Tate 译者: 巨成 / 戴玮 人民邮电出版社 2012 - 5
从计算机发展史早期的Cobol、Fortran到后来的C、Java,编程语言的家族不断壮大。除了这些广为人知的语言外,还涌现了Erlang、Ruby等后起之秀,它们虽被喻为小众语言,但因其独特性也吸引了为数不少的追随者。
Bruce A. Tate是软件行业的一名老兵,他有一个宏伟目标:用一本书的篇幅切中要害地探索七种不同的语言。本书就是他的成果。书中介绍了Ruby、Io、Prolog、Scala、Erlang、Clojure和Haskell这七种语言,关注每一门语言的精髓和特性,重点解决如下问题:这门语言的类型模型是什么,编程范式是什么,如何与其交互,有哪些决策构造和核心数据结构,有哪些独特的核心特性。
在这个飞速发展的信息时代,程序员仅仅掌握甚至精通一门语言是远远不够的。了解多门语言蕴涵的思维方式,在编码中互相借鉴,再挑出一两门对自己口味的语言深入学习,这些已经成为在软件行业中安身立命之本。从这个意义上说,每个程序员都应该看看这本书。
设计模式之禅 豆瓣
作者: 秦小波 机械工业出版社 2010 - 3
如果说“四人帮”的《设计模式》是设计模式领域的“圣经”,那么之后出版的各种关于设计模式的书都可称之为“圣经”的“注释版”或“圣经的故事”。本书是得道者对“圣经”的“禅悟”,它既不像“圣经”那样因为惜字如金、字字珠玑而深奥、晦涩和难懂,又比“圣经”的“注释版”更深刻和全面、更通俗和生动、更接近开发者遇到的实践场景,更具指导性。本书兼收并蓄、博采众长,也许是设计模式领域里的下一个里程碑之作。
全书共分为四部分,第一部分从原理的角度阐述了面向对象程序设计的6大原则;第二部生动地讲解和剖析了23种常见的设计模式,并进行了扩展,通俗易懂,趣味性极强而又紧扣模式的核心;第三部分对各种相关联的设计模式进行了深入分析和比较,旨在阐明各种设计模式比较理想的应用场景和它们之间的区别;第四部分探讨了设计模式的混编,讲解了如何在实际开发中将各种设计模式混合起来使用,以发挥设计模式的最大效用。最后,本书还附有一份设计模式彩图,可以裁剪,便于参考。
Social Network Analysis for Startups 豆瓣
作者: Maksim Tsvetovat / Alexander Kouznetsov O'Reilly Media 2011 - 10
SNA techniques are derived from sociological and social-psychological theories and take into account the whole network (or, in case of very large networks such as Twitter -- a large segment of the network). Thus, we may arrive at results that may seem counter-intuitive -- e.g. that Jusin Bieber (7.5 mil. followers) and Lady Gaga (7.2 mil. followers) have relatively little actual influence despite their celebrity status -- while a middle-of-the-road blogger with 30K followers is able to generate tweets that "go viral" and result in millions of impressions. O'Reilly's "Mining Social Media" and "Programming Collective Intelligence" books are an excellent start for people inteseted in SNA. This book builds on these books' foundations to teach a new, pragmatic, way of doing SNA. I would like to write a book that links theory ("why is this important?", "how do various concepts interact?", "how do I interpret quantitative results?") and practice -- gathering, analyzing and visualizing data using Python and other open-source tools.
深入浅出数据分析 豆瓣
Head First Data Analysis
8.1 (15 个评分) 作者: [美] Michael Milton 译者: 李芳 电子工业出版社 2009
《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
本书构思跌宕起伏,行文妙趣横生,无论是职场老手,还是业界新人,无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,去体味数据分析领域的乐趣与挑战。
社交网站的数据挖掘与分析 豆瓣
Mining the Social Web : Analyzing Data from Facebook, Twitter, LinkedIn, and Other Social Media Sites
作者: Matthew A·Russell 译者: 师蓉 机械工业出版社 2012 - 2
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。
•获得对社交网络世界的直观认识
•使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据
•学习如何应用便捷的Python工具来交叉分析你所收集的数据
•通过XHTML朋友圈探讨基于微格式的社交联系
•应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术
•通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
2014年11月29日 已读 感觉略坑,原书好象是2010年写的,翻到国内都2012年了,twitter的API都不知道改了几次了吧【笑而不语
coursera 技术
社会网络分析 豆瓣
Social Network Analysis for Startups
作者: Maksim Tsvetovat / Alexander Kouznetsov 译者: 王薇 / 王成军 机械工业出版社 2013 - 6
本书以基于Python的网络分析包NetworkX作为社会网络分析工具,但不是一本NetworkX使用手册。作者将重点放在如何从庞大的社会网络分析学术积累中,挑选最精要与最实用的知识点,以帮助读者形成关于社会网络分析的知识谱系图。全书可以分为四部分。第1章和第2章是基础知识,主要介绍社会网络分析的背景信息与图论基础知识。第3~5章主要介绍如何分析社会网络,分别从个体与群体两个层面,介绍社会网络的主要测量指标与分析方法。其中第3章重点介绍社会网络节点层面的四个核心指标:
程度中心性:哪些是明星人物?哪些是边缘者?程度中心性回答类似问题。这是最为人们理解的社会网络测量指标。以微博为例,程度中心性就是粉丝的数量,那些程度中心性高的人就是微博中的明星。
亲近中心性:亲近中心性通过点与其他点的距离来测量。那些在社交网络中经常与人互动、人际关系颇好的人,比如公司中的八卦传播者,往往亲近中心性得分较高。
居间中心性:节点的居间程度,表示一个网络中经过该点最短路径的数量。在网络中,节点的居间程度越大,那么它在节点相互之间的信息传播起到的作用也就越大。在两个社会网络之间的人,比如跨界者,往往拥有较高的居间中心性。
特征向量中心性:那些在社交网络中沉默却拥有极大权力的人物,如《教父》中的主人翁柯里昂。社会网络研究者将他们称为“灰衣主教”。特征向量中心性就是找出他们的办法。基本原理是,一个有着高特征向量中心性的行动者,与他建立连接的很多行动者往往也被其他很多行动者所连接。在社交网络中,有这样一种人,很多明星与其做朋友,即使他沉默不语,也可能是一位重要的人物。
社会网络分析不仅仅在节点层面测量。第4章、第5章介绍如何分析群体。其中,第4章主要介绍社群划分的基础知识:如何将庞大的社会网络划分为小的组块?如何利用社会网络中的结构洞牟利?如何进行三元组普查与分析?例如,如何通过岛屿方法逐步找出推特上埃及革命的成千上万条转发的核心人物?又如,如何评估埃及革命中一个人的信息传播能力?显然,如果你的朋友们相互信任,将比那种一个明星发言,粉丝们单纯收听的星形网络传播能力更强。第5章主要介绍二模网络与多模网络的基础知识。关系还会存在于不同类型的主体之间,比如公司雇佣员工、投资者购买公司股票、人们占有信息与资源等。这些关系称为二模关系。现实生活中的关系往往是二模或多模。比如在微博上,可以通过你的兴趣、地域、使用的标签来为你推荐新的朋友,或者基于你对一些公共事件的看法,将你划分到特定政治群体中,这些都是基于二模或多模网络的分析得出的。
第6章是全书最精彩的部分,关注信息如何传播,初步展示分析动态社会网络发展的建模技巧。一条微博如何从一两个人关注突然成为流行用语?作者在实验中发现,当网络密度接近7%的时候,将从线性增长(每次增加一条连接)转化为病毒式扩散,也就是说,如果转发一条微博、加入一个网络社群等的人数比例达到7%,其他人将会在关键阶段马上跟进。这是一个推动脸谱走出哈佛大学的神奇数字。脸谱一步一步地跃迁,总是遵循一个规则——在一个社群里到达饱和点之后才移入一个更大的社群。作者通过手写Python算法,为读者打开动态社会网络与网络仿真的大门——我们如何用算法来模拟人类社会各类关系的变迁?有了自己亲手实践算法的经验,读者未来使用netlogo等网络仿真软件,将更加得心应手。
对于初学者来说,第4~6章这三章有一定难度,需要同时理解社会科学与编程技巧两方面知识。第7章则简单明了,主要介绍获取网络数据的入门知识。如果希望深入了解,可以阅读作者推荐的相关资源。附录A介绍收集社会网络分析所需数据的传统方法、伦理准则与相关API。附录B介绍如何安装本书涉及的相关软件,如NetworkX、matplotlib等。
总而言之,作为一本技术非常新颖的入门读物,本书通俗易懂,基于Python进行分析使得其灵活性变得更高。可以说,本书令学习者从一开始就具有上手实践的能力,除介绍网络数据获取技巧、网络抽样方法、网络在个体与群体两个层面的基本属性之外,还涉及目前日益热门的网络模拟方法,融合基础理论与算法于一身。简约却不简单,上升空间非常大!无论你是对社会网络感兴趣的大众读者,还是社会网络的专业研究者、开发者,相信本书都会在社会网络的理论与实践两方面给予启发!