现在是2018.4.24,晚上12.00,记录今天的一天。
今日时间安排
今天因为考试,下午突然多了半天的空闲,觉得特别恐慌,不知所措,后来调整了一下,找了本书看,而且躲到另一个办公室去看书,保证自己在安静的环境下看书。
突然发现自己已经无法面对整块的时间的流逝,有种谋杀自己生命的感觉。
总体来说,今天很闲,闲的很慌,但是我怎么还是这么晚睡觉…
今日阅读
摘记
如今,数据已经成为了一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。数据的奥妙只为谦逊、愿意聆听且掌握聆听手段的人所知。
这仅仅只是一个开始,大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。
技术成熟度曲线
当数字数据洪流席卷世界之后,每个地球人都可以获得大量数据信息,相当于当时亚历山大图书馆存储的数据总量的320倍。
人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度则比世界经济的增长速度快9倍。
当我们改变规模时,事物的状态有时也会发生改变。(事物达到分子级别时,物理性质会发生改变,比如铜能导电,但是到达纳米级别时,在磁场中不导电。)
系统可以通过一种“反馈学习”的机制,利用自己产生的数据判断自身算法和参数选择的有效性,并实时进行调整,持续改进自身的表现。
三个转变:
1.在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。
2.研究数据如此之多,以至于我们不再热衷于追求精确度。
随着规模的扩大,对精确度的痴迷将减弱。
适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。
3.我们不再热衷于寻找因果关系,而关注相关关系。
数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和“信息”根本搭不上边的事情。
大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。
思考与感悟
今天阅读《大数据时代》一书的序言章节,向我揭示了关于大数据已经以及未来会带给我们的重大改变,从优缺来看,
优点是:提供大量数据对未来生活进行合理预测。缩短我们的时间、金钱、成本。
缺点是:我们的个人隐私是否还有?怎么保护?太多预知的判断和可能性,我们如何应对?
在这里还提到了三个由大数据时代来临而带给人的改变:
1.所有数据的采集
2.不再沉迷精确度
3.追求数据的相关性
最有颠覆的是2.3两项。
1.精确度问题,就好像我们高中做平均数问题,当样本量为10个的时候,我们会想要让数据更加精确。但当数据是10000的时候,我们计算的能力还无法满足,就会适当估计每个数据的大小,来做平均数。
当数据海量时,我们已不能够或不需要对所有数据进行精确记录和分析,而是用更宏观的思考方式,站在大局观的角度去思考和处理问题,掌握一个大体的发展。
2.相关性。海量的数据,我们很难再对数据做一个因果关系的分析,因为如果深挖因果关系,那数据就会让你一团糟,甚至我们无法探求到最根本的原因。而相关性分析则不同。
比如我们想知道某地房价的问题,如果用因果关系分析,则需要深入了解这个地区的政治、经济、生态、地理位置等深层原因,才能分析出它的价格走向。
如果是相关性分析,那只需要把过往所有的房价变化数据进行一个分析,确定地区,筛选位置,那一个大致走向的价格变化图就直接显示,虽然这是一个预测,但是也能大致解决用户的需求。
所以说大数据时代,用数据说话,而过去,我们用经验说话。经验是数据+感性,而大数据,只有理性的分析。
【Day|Day 42/100 浪费时间,浪费生命】如果分析那些大师们,其实他们自身也是大数据,只是这个大数据体量有限,而且无法做到复制,对于代代相传是限制,而大数据依靠计算机、算法、科技发展,只会随着发展被挖掘出更多更多的可能,所以这是一个机遇,不要逃避。