概述
最近才开始看大数据时代这一经典的书,虽然书中一些事例已经耳熟能详,但是书中的思想依然那么新颖,那么经典。甚至在我查了这本书的出版日期是在2013年,英文原版甚至更早,距离今天已有六年之久,这六年大数据又有了许多重大的突破,但是这些都不影响我们学习这一经典著作。
在绪论和引言中作者已经鲜明的表明了自己的观点:
1)大数据时代相关比因果更重要。
2)数据的收集能力使得我们的数据量爆炸性增长。
3)大数据的核心是预测
4)全数据处理取代随机样本
作者在引言中超前的认为数据将成为一种资产。电脑存储和分析数据的方法取代电脑硬件成为了价值的源泉。虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。
第一章的核心思想是样本=总体,抛弃采样
作者认为采样,具有随机不足偏差严重,不可发现新知识等弱点,是收到采集数据能力和处理数据能力不足的约束下的一种好方法。人们只能从采样数据中得出事先设计好的问题的结果——千万不要奢求采样的数据还能回答你突然意识到的问题。
但是全数据时代小公司也可以使用全部的数据,大也是一个相对的概念
人 | 公司 | 项目 | 规模 |
谷歌 | 频繁检索词条/疾控中心流感数据 | 5000万 | |
奥伦.爱奇奥尼 | Farecast | 飞机票价预测 | |
乔布斯 | 23andme | 癌症病变药物失效 | 自身所有DNA和肿瘤DNA排序 |
xoom | 跨境汇款异常交易报警 | ||
相扑比赛 | 比赛作弊 | ||
lytro相机 | 记录所有光,重复聚焦 | 1100万束 | |
艾伯特-拉斯洛-巴拉巴西 | 关系网中有众多好友的人重要性不如一个与很多关系网外有联系的人 |
最后
以上就是糊涂小海豚为你收集整理的《大数据时代》读后感(一)的全部内容,希望文章能够帮你解决《大数据时代》读后感(一)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复