大数据
语言探秘 豆瓣
作者: 李斌 出版社: 南京师范大学出版社 2018
迷惘于繁多的语言学术语?纠结于不知道看哪本语言学的着作?论着期刊多如牛毛,思路混乱,头脑发麻,欲登堂而不知门径?研究选题毫无头绪?来瞧瞧这本书吧,帮你理清思路,一起来讨论语言的基本理论与现实问题:语言从哪里来,将来会怎样,我们的汉语为什么和英语不同,为什么要学英语,为什么要使用汉语拼音,为什么汉语里同音字特别多,为什么会有那么多种汉字的字体,为什么要用计算机研究语言,修辞手法能不能计算,为什么语言研究那么难,为什么语言研究有那么多禁区,为什么语言信息产业如此红火……
本书在语言大数据和人工智能的知识体系下,将语言学和汉语的基本问题,用对话的形式来讨论,步步推进,深入浅出地揭示语言的神奇与奥妙。对语言学、现代汉语、词汇语义学、计算语言学等方向的科研人员、本科生、研究生具有较高参考价值。
2020年12月19日 已读
主题铺张太开了,导致非作者研究分支的认识更像是作者自己的观念,而非熟练掌握相应分支已有学术成果后的科普。无论是语言文字起源和发展问题还是心理语言学问题作者都值得引介更好的成果或讨论。其实不如专注于写计算语言学的科普了,本身太广阔研究范围的科普由单人写就很难驾驭。冯序挺好。
人工智能 冯志伟 大数据 应用语言学 汉语
数据压缩入门 豆瓣
作者: [美]柯尔特·麦克安利斯(Colt McAnlis)[美]亚历克斯·海奇(Ale 译者: 王凌云 出版社: 人民邮电出版社 2020 - 3
本书的主题是数据压缩,也就是用最紧凑的方式来表示数据。本书先讲解了5类数据压缩算法,即变长编码、统计压缩、字典编码、上下文模型和多上下文模型,然后介绍了香农的信息论,以及怎样通过各种方法来突破熵,如统计编码、自适应统计编码、字典转换、上下文数据转换、数据建模等。本书还讨论了数据压缩中的一些要点,如多媒体数据压缩和通用压缩,并介绍了有损数据压缩。本书最后说明了数据压缩与你、你的公司以及未来的技术是如何相互关联的。
计算社会科学引论 豆瓣
作者: 王国成 出版社: 中国社会科学出版社; 第1版
人类行为是人文社会科学研究的共同对象和逻辑起点,《计算社会科学引论:从微观行为到宏观涌现》在深化社会经济行为的基础上,重点探讨人类社会复杂现象的行为成因、传导机理和演变过程等;用观点鲜明的大跨度交叉学科方法,将学术观点与研究内容紧密相联:既包括极具特色的异质交互主体多元行为属性内生化分析的原刨理论,又有基于主体行为的一体化建模(ABM)、社会科学仿真模型和软件、计算博弈论和计算模拟实验等方法介绍,还有在集体行动、经济、金融、政治、法律、社会、历史、语言传播等社会科学领域以及管理中行为建模计算的应用案例和经验,凸显用微观行为分析建模和计算实验方法解决社会经济宏观复杂问题的“通宏洞微”特点,在行为基点上借助计算实验方法,促进各分支学科的整合,解决复杂情景决策,提升社会科学研究方法论。
强化学习(第2版) 豆瓣
Reinforcement Learning: An Introduction Second edition
作者: 【加】Richard S. Sutton(理查德·桑顿) / 【美】Andrew G. Barto(安德鲁·巴图) 著 译者: 俞凯 等 出版社: 电子工业出版社 2019 - 9
《强化学习(第2版)》作为强化学习思想的深度解剖之作,被业内公认为是一本强化学习基础理论的经典著作。它从强化学习的基本思想出发,深入浅出又严谨细致地介绍了马尔可夫决策过程、蒙特卡洛方法、时序差分方法、同轨离轨策略等强化学习的基本概念和方法,并以大量的实例帮助读者理解强化学习的问题建模过程以及核心的算法细节。
《强化学习(第2版)》适合所有对强化学习感兴趣的读者阅读、收藏。
计算社会学 豆瓣
Bit by Bit: Social Research in the Digital Age
9.2 (5 个评分) 作者: [美]马修·萨尔加尼克(Matthew J. Salganik) 译者: 赵红梅 / 赵婷 出版社: 中信出版集团 2019 - 5
我们已经见证了社交媒体、智能手机以及其他科技奇迹的诞生与进化,这些科技工具让我们能够以前所未见的规模和深度采集并处理有关人类行为的数据,从而为研究人类社会提供了一个全新的路径。这本书是一部里程碑式的作品,它将彻底改变下一代社会科学家和数据科学家探索世界的方式。
 大数据的10个共同特征是什么?
 如何通过数据预测美国总统大选的结果?
 如何在短时间内对100万个星系进行分类?
 大规模数据采集面临着怎样的道德伦理困境?
 科技公司是否在监视我们的行为,数字时代是不是将我们带进了“全景监狱”呢?
在计算社会学这一新兴领域,作者阐述了数字革命如何扭转了社会科学家和数据科学家观察行为、提出问题、开展实验和进行大规模协作的方式,详细描述了大批真实的案例,并且划定了面临伦理挑战时需要遵循的4项原则。
这本书用全新的数据模式解锁了社会学。对社会科学家来说,它是一本跨界指南之书;对数据科学家来说,它是一本素养提升之作。
链接 豆瓣
Linked: How Everything Is Connected to Everything Else and What It Means for Business, Science, and Everyday Life
作者: [美] 艾伯特-拉斯洛·巴拉巴西 译者: 沈华伟 出版社: 浙江人民出版社 2013 - 8
[内容简介]
★《链接》是《爆发》的作者,艾伯特-拉斯洛•巴拉巴西的成名之作,同时也是复杂网络的奠基之作,社交网络的入门之作。巴拉巴西之前,随机网络理论一直主导者我们的网络思维,是巴拉巴西第一个证明了,我们不是生活在随机世界里,真实网络是无尺度的。
★巴拉巴西在书中追溯了网络的数学起源,分析了社会学家在此基础上得出的研究成果,最后提出自己的观点:我们周围的复杂网络,从鸡尾酒会、恐怖组织、细胞网络、跨国公司到万维网,等等,所有这些网络都不是随机的,都可以用同一个稳健而普适的架构来刻画。这一发现为我们的网络研究提供了一个全新的视角。
★虽然《链接》写于十年前,但这本书的精神到现在丝毫没有褪色。它带给了我们一种整体的、关联的、系统论的审视世界的方式,使我们不仅仅将视野局限于孤立的单元。广泛存在的链接是从简单到复杂、从单一到多样、从平凡到璀璨的桥梁。重温《链接》一书,领略科学家们在网络科学伊始对链接泛在性、数据复杂性、规律普适性的认识和思考,对我们在大数据时代抓住机遇、迎接挑战将大有裨益。
★链接一书可以被视为复杂网络的基石,大数据时代的开端。
[编辑推荐]
★复杂网络研究权威 ,无尺度网络创立者,H-指数高达96的论文狂人,诺贝尔奖大热人选,超越《黑天鹅》的惊世之作《爆发》的作者艾伯特-拉斯洛•巴拉巴西经典力作
★中科院计算所所长助理、中国科学院网络数据科学与技术重点实验室主任程学旗,电子科技大学教授、互联网科学中心主任周涛专文推荐。
★巴拉巴西博士后,中科院计算所副研究员沈华伟打造唯一权威版本。
★湛庐文化出品。
女士品茶 豆瓣 Goodreads
The Lady Tasting Tea:How Statistics Revolutionized Science in the Twentieth Century
7.7 (12 个评分) 作者: [美]戴维·萨尔斯伯格 译者: 刘清山 出版社: 江西人民出版社 2016 - 8
大数据时代最该懂的学科就是统计学
科学松鼠会推荐统计学领域入门必读书
...................
※编辑推荐※
★统计学入门首选读本,科学松鼠会强力推荐!
这是一本经典的入门级读物,每介绍一个新的概念,都会进行大量的背景介绍,再辅以相关奇闻异事。就算是对于一个门外汉来说,也能读懂一个特定概念是做什么用的。
★像小说一样的科普书,堪称统计学领域的《苏菲的世界》
在作者笔下,固执的皮尔逊、低调的戈塞特、天才的费舍尔,一如武林高手一样,在统计学的思想领域激烈交锋。他们和后续各个时代代表性的天才,共同演绎了二十世纪这场绚丽多彩又跌宕起伏的统计学革命。有读者评论,本书之于统计学,一如《苏菲的世界》之于哲学。
★了解统计学的人,运气都不会太差。大数据时代,你需要懂点统计学思想。
统计学从不猜想,而是测量未来!从买乐透到大数据,全都需要统计学,不懂统计学,你就等着被骗吧!
...................
※内容简介※
统计学之所以被滥用、误用,其实是因为它太有用,在某种程度上,可以说改变了世界上处理问题的方式。
这是一部统计学的史诗。一百多年来,统计学从无到有,以至于蔚为壮观。一部统计学的发展史,就是一部不断革新现有科学体系的历史。本书深入浅出地描绘了这一历程,为读者奉献了一场思想的饕餮盛宴。
这是一部关于叱咤风云的统计学学霸的传奇故事书。回望那段波澜壮阔的时代,一张张脸孔水一样掠过。在英国剑桥的某个午后,有位女士声称,把茶加到牛奶里,和把牛奶加到茶里,两种方法调出来的下午茶喝起来味道不同。在座的科学家都对她的说法嗤之以鼻,但有位来访的瘦小绅士,R. A. 费希尔,提议要用科学的方法,来检验这位女士的假设……本书以这位喝下午茶的英国女士为起点,带领读者一一回顾“统计”这门应用范围最广的科学,了解若干重要理论的发展过程与应用,亲近那些隐身幕后的统计学家,看看统计究竟为今天这个世界,带来了什么样的改变。
这是一部大数据时代不容错过的实用之书。大数据时代,一切以数据说话,如何解读数据便与每个人的日常生活息息相关。统计学的本质就在于解读数据,读懂了本书,你就是大数据时代的明白人。
The Fourth Paradigm 豆瓣 Goodreads 开放图书馆
作者: Tony Hey 出版社: Microsoft Research 2009 - 10 其它标题: The Fourth Paradigm: Data-Intensive Scientific Discovery / The fourth paradigm
This book presents the first broad look at the rapidly emerging field of data-intensive science, with the goal of influencing the worldwide scientific and computing research communities and inspiring the next generation of scientists. Increasingly, scientific breakthroughs will be powered by advanced computing capabilities that help researchers manipulate and explore massive datasets. The speed at which any given scientific discipline advances will depend on how well its researchers collaborate with one another, and with technologists, in areas of eScience such as databases, workflow management, visualization, and cloud-computing technologies. This collection of essays expands on the vision of pioneering computer scientist Jim Gray for a new, fourth paradigm of discovery based on data-intensive science and offers insights into how it can be fully realized.
第四范式 豆瓣
2012 - 6
《第四范式:数据密集型科学发现》系统介绍了地球与环境科学、生命与健康科学、数字信息基础设施和数字化学术信息交流等方面基于海量数据的科研活动、过程、方法和基础设施,生动揭示了在海量数据和无处不在网络上发展起来的与实验科学、理论推演、计算机仿真这三种科研范式相辅相成的科学研究第四范式——数据密集型科学发现,进一步探讨了这种新范式的内涵和内容,包括利用多样化工具不间断采集科研数据、建立系统化工具和设施来管理整个数据生命周期、开发基于科学研究问题的数据分析及可视化工具与方法等,并深入探讨了这种新范式对科学研究、科学教育、学术信息交流及科学家群体的长远影响。
《第四范式:数据密集型科学发现》将帮助从事科学研究、科技研究规划、科技政策等领域的科研人员和管理者理解和把握科研环境与科研方法的革命性变化,也将为学术出版、文献情报、科学数据及其他从事信息与知识管理的人士提供未来的战略视角,同时也有助于有志于科学研究和学术信息交流管理的高层次学生了解未来的挑战和需求。
A Billion Wicked Thoughts 豆瓣
作者: Ogi Ogas / Sai Gaddam 出版社: Dutton Adult 2011 - 5
Two maverick neuroscientists use the world's largest psychology experiment-the Internet-to study the private activities of millions of men and women around the world, unveiling a revolutionary and shocking new vision of human desire that overturns conventional thinking.
For his groundbreaking sexual research, Alfred Kinsey and his team interviewed 18,000 people, relying on them to honestly report their most intimate experiences. Using the Internet, the neuroscientists Ogas and Gaddam quietly observed the raw sexual behaviors of half a billion people. By combining their observations with neuroscience and animal research, these two young neuroscientists finally answer the long-disputed question: what do people really like? Ogas and Gaddam's findings are transforming the way scientists and therapists think about sexual desire.
In their startling book, Ogas and Gaddam analyze a "billion wicked thoughts" on the Internet: a billion Web searches, a million individual search histories, a million erotic stories, a half-million erotic videos, a million Web sites, millions of online personal ads, and many other enormous sources of sexual data in order to understand the true differences between male and female desires, including:
•Men and women have hardwired sexual cues analogous to our hardwired tastes-there are sexual versions of sweet, sour, salty, savory, and bitter. But men and women are wired with different sets of cues.
•The male sexual brain resembles a reckless hunter, while the female sexual brain resembles a cautious detective agency.
•Men form their sexual interests during adolescence and rarely change. Women's sexual interests are plastic and change frequently.
•The male sexual brain is an "or gate": A single stimulus can arouse it. The female sexual brain is an "and gate": It requires many simultaneous stimuli to arouse it.
•When it comes to sexual arousal, men prefer overweight women to underweight women, and a significant number of men seek out erotic images of women in their 40s, 50s, and 60s.
•Women enjoy writing and sharing erotic stories with other women. The fastest growing genre of erotic stories for women are stories about two heterosexual men having sex.
•Though the male sexual brain is much more different from the female sexual brain than is commonly believed, the sexual brain of gay men is virtually identical to that of straight men.
Featuring cutting-edge, jaw-dropping science, this wildly entertaining and controversial book helps readers understand their partner's sexual desires with a depth of knowledge unavailable from any other source. Its fascinating and occasionally disturbing findings will rock our modern understanding of sexuality, just as Kinsey's reports did sixty years ago.
R语言实战 豆瓣
R in Action
9.3 (6 个评分) 作者: 卡巴科弗 译者: 高涛 / 肖楠 出版社: 人民邮电出版社 2013 - 1
数据时代已经到来,但数据分析、数据挖掘人才却十分短缺。由于“大数据”对每个领域的决定性影响, 相对于经验和直觉,在商业、经济及其他领域中基于数据和分析去发现问题并作出科学、客观的决策越来越重要。开源软件R是世界上最流行的数据分析、统计计算及制图语言,几乎能够完成任何数据处理任务,可安装并运行于所有主流平台,为我们提供了成千上万的专业模块和实用工具,是从大数据中获取有用信息的绝佳工具。  本书从解决实际问题入手,尽量跳脱统计学的理论阐述来讨论R语言及其应用,讲解清晰透澈,极具实用性。作者不仅高度概括了R语言的强大功能、展示了各种实用的统计示例,而且对于难以用传统方法分析的凌乱、不完整和非正态的数据也给出了完备的处理方法。通读本书,你将全面掌握使用R语言进行数据分析、数据挖掘的技巧,并领略大量探索和展示数据的图形功能,从而更加高效地进行分析与沟通。想要成为倍受高科技企业追捧的、炙手可热的数据分析师吗?想要科学分析数据并正确决策吗?不妨从本书开始,挑战大数据,用R开始炫酷的数据统计与分析吧!  本书内容:  R安装与操作
数据导入/导出及格式化双变量关系的描述性分析回归分析
模型适用性的评价方法以及结果的可视化
用图形实现变量关系的可视化
在给定置信度的前提下确定样本量
高级统计分析方法和高级绘图
大数据与中国历史研究(第1辑) 豆瓣
作者: 付海晏 主编 / 徐剑 主编 出版社: 社会科学文献出版社 2017 - 6
《大数据与中国历史研究》由华中师范大学人文社会科学高等研究院和历史文化学院共同主办。自2013年开始,华中师范大学与香港科技大学开始在大数据历史研究以及人才培养方面进行合作,在专业课程设置方面,大数据历史专业开设了诸多较有特色的专业课程,其中“大数据与中国历史”系列讲座系高等研究院、历史文化学院共同举办,邀请在量化历史研究、数字人文研究方面素有专长的资深教授、新锐青年学者做专题讲座,本书即部分学者研究成果、演讲稿的结集。
大数据日知录 豆瓣
作者: 张俊林 出版社: 电子工业出版社 2014 - 9
大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。
《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。
《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。
IBM SPSS数据分析与挖掘实战案例精粹 豆瓣
作者: 张文彤 / 钟云飞 出版社: 清华大学出版社 2013 - 2
《IBM SPSS数据分析与挖掘实战案例精粹》以IBM SPSS Statistics 20.0和IBM SPSS Modeler 14.1为工具,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,使读者在阅读时能突破方法和工具的局限,真正聚集于对数据分析精髓的领悟。《IBM SPSS数据分析与挖掘实战案例精粹》所附光盘包括案例数据和分析程序/流文件,读者可完整重现全部的分析内容。
魔鬼数学 豆瓣
How Not to Be Wrong: The Power of Mathematical Thinking
7.3 (6 个评分) 作者: [美] Jordan Ellenberg 译者: 胡小锐 出版社: 中信出版集团 2015 - 9
如果你是一个有“数学焦虑症”的人,你可能不会相信有一天你会爱上数学。原因在于,我们在学校所学的数学知识看上去不过是一堆沉闷的规则、定律和公理,都是前人传下来的,而且是不容置疑的。在本书中,世界知名数学家乔丹·艾伦伯格告诉我们这样的认识是错误的。数学与我们所做的每一件事都息息相关,可以帮助我们洞见在混沌和嘈杂的表象之下日常生活的隐性结构和秩序。数学是一门告诉我们“如何做才不会犯错”的科学,是经年累月的努力、争论所锤炼出来的。
你应该提前多长时间到达机场?民意调查的结果真的能代表人们的意愿吗?为什么父母都是高个子,孩子的身高却比较矮?用什么策略买彩票才能中大奖?本书运用数学方法分析和解决了很多的日常生活问题,帮助数学门外汉习得用数学思维思考问题的技能。
作者用数学这条主线穿起了时空,从每时每刻到宇宙空间,中间还穿插了很多人和事物,比如棒球、里根经济学、伏尔泰、意大利文艺复兴时期的绘画、人造语言等。本书带领我们踏上了一段精彩绝伦的数学思维之旅,旅行过后,相信你可以成为一个更棒的思考者。作者从历史及最近的理论发展中汲取精华,向我们展示了数学知识的魅力和力量。数学可以让我们更好地思考:它可以磨练我们的直觉,让我们的判断更敏锐,它还可以驯服不确定性,让我们更深入地了解世界的结构和逻辑。
拥有了数学工具,我们就可以把那些我们想当然的事情看得更透彻,从而做出正确的决策。