我要投稿 投诉建议

大数据类的读书笔记

时间:2021-01-30 09:12:24 读书笔记 我要投稿

大数据类的读书笔记

  读书笔记是读书的时候经常做的笔记,下面就让我们来看看大数据类的读书笔记!欢迎阅读!

大数据类的读书笔记

  大数据类的读书笔记

  未来的十年,将是大数据引领下的智慧科技时代。不管你是否意识到它的存在,大数据都将越来越快地改变我们这个时代,包括我们的生活方式。

  维克托·迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一。他通过一个大家熟知的事例,来帮助我们理解“大数据”的潜在影响力,那就是四个世纪之前望远镜和显微镜的发明。望远镜能够让我们感受宇宙,显微镜能够让我们观测微生物,它们都是收集海量数据的新工具,因为这种工具的发明,人们同步更新了分析数据的技术和方法,促进了人们对世界更好的理解。如果说望远镜和显微镜是测量领域中的一场革命,那么今天的数据测量就相当于是现代版的望远镜、显微镜。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富,以及更多的传感设备、移动终端接入到网络,由此产生的数据及数据的增长速度比历史上的任何时期都要多、都要快。一个大数据的时代,不经意间顺理成章地翩然而至。

  一、什么是大数据?

  大数据是当前最热门的话题之一。但什么是大数据,人们尚未给出确切的定义。首先,“大数据”是相对过去小的、局部性的数据而言的;其次,利用大数据进行分析和工作时,所依据的关于此事尽可能完整的数据,从而“一览众山小”,而不是采用局部的小数据,从局部推断整体。

  维克托也并未直接给出大数据的定义。不过,他用三大转变描述了大数据的特性:

  转变之一:在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。例如一项针对相扑比赛中非法操纵比赛结果的研究对64000场比赛进行了分析,这算不上一个很大的数字,但由于这是过去十年所有的比赛,所以它是大数据。

  转变之二:由于有了更多的数据,我们可以接受更多的混杂、更多数据上的不精确。如果我们对于一个事物只有50个数据点,那么每一个数据点都必须非常精确,因为每个数据点都是有用的;但是如果我们有5000万个,去掉10个,甚至去掉1000个都没有太大的问题。

  转变之三:不再探求难以捉摸的因果关系,转而关注事物的相关关系。分析大数据主要为了预测未来“是什么”,而不是“为什么”。因为很多时候我们以为我们找到了事情背后的原因,实际上却没有找到。更多时候知道了“是什么”就足够了。例如知道流感将会扩散到哪里就足够了,我不需要知道为什么;知道什么时候在网上购买机票能够获得最优惠的价格就足够了,我不需要知道为什么此时价格最低。

  二、大数据带来的变化

  大数据从根本上改变我们认识世界和改变世界的方式。很多传统的习惯将被颠覆,很多旧的制度将面临挑战。举例来说:

  第一,科学探究的思路和方式受到挑战

  探究是新课程改革中的一个热词,是促进学校教学与科学研究相融合的实践举措。科学探究的基本路径是:发现问题,提出假设,制定方案,实践探究,分析数据,得出结论。之所以会梳理出这样一个探究的路径,与我们对问题知晓的信息过少有关。换句话说,对所要研究的事物,我们知道的数据很少,需要从这些很小的数据出发,通过猜想和假设,进行试探性的研究,如果研究得出的结果和自己的假想是一致的,则说明我们的假说是正确的,这些假说会上升为对该事物描述的知识,我们掌握该事物的数据也随之增加。

  利用测量所获得的点滴数据,从一个局部来推测世界是怎样的,这是科学探究的基本思路和方式。长期以来,我们总是通过这样的方式来认识世界,对其有宗教般的信仰。尽管我们知道,决策者总是先有了想法,才会提出假设。如果决策者自身对所研究的事情存在着偏见,所提出的假设就很难得到实证的支持,这往往会导致探究花费了很长的时间、很大的物力和财力,也常常劳而无功。但科学研究者还是坚定不移地沿着这条道路前行,学校在教学中也将其作为科学研究的基本规范来传授。

  在大数据时代,这样的研究方式收到了极大的挑战。先举个事例来说吧。手机辐射是否能够致癌?关于这个问题,无论我们的假设如何,实验的设计都很难进行。首先,样本选择过少,没有统计学上的意义;其次,不能拿人做研究对象;第三,短时间的研究很难观察到变化。有了大数据之后,这样的难题就可以迎刃而解了。前段时间,丹麦就进行了这样的研究。丹麦拥有1985年手机推出以来所有手机用户的数据库。他们从这个数据库中分析了1990年至2007年拥有手机的所用用户的数据,同时,他们还收集了这一期间医院收集的所有癌症患者的数据,然后分析手机用户是否比非手机用户有更高的癌症发病率。这两个数据库本身是完全独立的,在作分析之前从来没有想过可以做这样的研究。结果表明,使用移动用户和癌症风险增加之间不存在任何关系。2011年10月,这一研究的结果发表在《英国医学杂志》上。

  上述的案例告诉我们,在获得了大量的数据,能够对事物的整体进行全面的认识之后,假想就没有意义了,我们可以直接根据全面的数据做出结论。

  大数据类的.读书笔记2

  数据、技能和思维的整合

  粗度大数据时代。作者运用丰富的商业案例为读者解释了已经到来的大数据时代的特征,以及存在的种种机会。大数据的核心是数据,一切靠数据说话,这也就决定了大数据的最终玩家是掌握数据的公司,放眼全球,最有优势的公司无疑是谷歌、亚马逊。对于中国来讲,搜索类公司百度,电商公司京东、亚马逊、当当,B2C公司淘宝,社交公司人人、微博、腾讯等。这些公司掌握了大量的数据,但是究竟能不能做起来还需要看思维,阿里已经成立了研究院,值得看好,百度我还没有看到有什么动静,微博现在逐渐没落,希望不要步人人网的侯成。

  大数据将会是主流,这是和当今巨大的数据采集、存储和处理方式决定的,可以说大数据强调的相关关系为人们快速而准确的判断事物的发展规律提供了一种全新的思路,这是因为巨大的数据量,所以相关关系才显得尤为重要。但也存在一个问题,如果只是关注事物之间的相关关系,而忽略了事物之间相关关系的内在原因,是否会是功利主义的又一次胜利?是否只是截取社会规律涌动洪流上的漂亮浪花,而忽略了内部真正的推动力量?

  还有一点疑惑,如果只是从相关关系入手,那么得到的都将是已经存在的规律,预测的也是将会发生的事件,对于全新的事件将无法预测,创新性很难实现。这也是作者观点非常不可取的地方。相关关系必然很重要,但是因果关系更加重要,而现在忽略因果关系的原因我认为本质上讲是商业社会的逐利本质决定的,人们不可能花费大量的时间、金钱去探索一些对自己的利益提升没有很大帮助的事情,而相关关系恰恰能最大限度的满足人们快速获利的动机。

  总的来说,《大数据》这本书对于在商业层面大数据的运用是很有帮助的,在此基础上,作者也从基于大数据的商业模式、社会管理手段以及社会所面临的道德问题进行了简单的探讨,总的来说从宏观上把握了已经到来的大数据时代,是一本不错的类似读物,但深度还略显不足。

  我相信大数据时代将给人们的生活带来极大地便利以及促进整个社会资源配置效率的提高,这是大数据积极的一方面。但是从我个人来讲,我不希望大数据包含自己生活的方方面面,我需要隐私,更重要的我希望自己能有新的生活轨迹,而不是按照自己之前的轨迹不断的重复下去。毕竟,大数据时代所有关于未来的预测都是基于对以前的分析。这也是我最担心的。

【大数据类的读书笔记】相关文章:

小升初面试必考的5大类问题02-21

工科类毕业论文的答辩技巧大揭秘12-03

中文系三大类就业方向11-28

美国留学三大类奖学金申请条件10-21

中国十大医药类大学排名06-28

关于面试口语6大类问题齐分享03-18

中国十大医药类大学排行榜名单07-04

数据库开题报告12-21

2017高考专业:管理学类六大热门专业06-19

大学四级仔细阅读三大类题型的答题技巧03-30