大数据是什么?


采集记录足够多的数据 。使工作更加针对化和精准化 。这是大数据吗?这不是大数据而只是数据化 。
什么是大数据呢?例如洛杉矶警方曾对以往的刑事案件做了统计 。通过算法得出了第二天的高概率犯罪地点 。然后有针对性的派警察去该处巡逻 。从而使得当地的犯罪现象下降20% 。这是大数据 。
再比如 。经济学家都认为股票无法预测 。而一位剑桥大学毕业的博士搞了个公司 。对有史以来几乎所有的证券交易的数据进行记录 。然后通过算法进行分析 。
他对什么国家政策、公司业绩、行业走向等等一眼都不看 。100%地排除主观意志的 。只根据计算结果来进行投资 。最后赚了大钱 。这是大数据 。
大数据的精髓并不在于数据的精准和数量 。而在于对内在规律的挖掘和对未来趋势的预测 。其思路是:一个结果是有很多原因的 。原因作用的强度可能是随机的 。我们对其中作用的机理并不清楚 。
我们难以找出规律性 。但知道规律性就蕴含在结果数据之中 。如果我们能建设合适的模型 。写出好的算法 。就有可能把这个规律性提炼出来 。从而能科学地发现真相和预测未来 。
今天上午在贵州省大数据中心看到了大数据应用的事例 。

大数据是什么?

文章插图
金润建设和鹏润达这两家企业分别投标200多次 。一次也没中过 。依然积极地投 。投标是要成本的 。这两家公司那里来的动力?
大数据是什么?

文章插图
通过大数据的知识挖掘技术 。发现了它们总是陪着固定的一家公司一同招标 。最后总是那家公司中标 。围标、串标、陪标的秘密被大数据挖掘出来了
大数据是什么?

文章插图
大数据是什么?

文章插图
大数据是什么?

文章插图
数据蕴含着无穷的价值 。大数据就是“钻石矿” 。但必须善于挖掘 。
其他观点:
「大数据」(big data)和「资料科学家」(data scientist)是近年来商业界的热门关键字 。不过 。你感受到大数据的重要性 。却未必真正了解大数据和你我的工作、和企业的关联性是什么?以下5 张图 。让你快速了解大数据的商业应用 。
Q1. 什么是大数据?
A : 狭义的定义是指 。符合「3V」条件的数据资料 。分别是:
Volume(大量):以过去的技术无法管理的资料量 。资料量的单位可从TB(terabyte 。一兆位元组)到PB(petabyte 。千兆位元组) 。
Variety(多样性):企业的销售、库存资料;网站的使用者动态、客服中心的通话纪录;社交媒体上的文字影像等企业资料库难以储存的「非结构化资料」 。
Velocity(速度):资料每分每秒都在更新 。技术也能做到即时储存、处理 。广义的定义 。《大数据的获利模式》作者城田真琴认为 。还要包括具备储存、处理与分析这些资料的技术 。和能够从这些资料中取出有用资讯或洞见的人才和组织 。
大数据是什么?

文章插图
Q2. 大数据分析和商业智慧(BI 。business intelligence)有什么不同?
A : 美国顾问机构顾能(Gartner)分析师霍华?瑞斯纳(Howard Dresner)在1980年代提出「商业智慧」概念 。指有系统地储存企业内、外部资料 。并加以分析 。辅助商务决策 。瑞斯纳认为 。经理人应该亲自经手资料 。以达到迅速决策与提高生产力的目标 。
商业智慧可分析过去发生什么事 。以及为什么会发生这件事 。像是利用统计学回归分析 。从A产品过去一年的销量结构 。找出销售下滑的原因 。大数据则可根据目前发生了什么事 。预测未来将发生什么事 。例如 。电商可即时监控销售情况 。预测顾客回购周期 。
大数据是什么?

文章插图
Q3. 一般企业有哪些数据可用?
A :《大数据的获利模式》作者城田真琴将企业能取得的资料分为4 种:
公司本身的事业活动资料:属于公司的核心资料 。例如便利商店的POS 系统资料 。
公司背景资料:比方说员工的通讯录或财务报表 。但是对服务顾客没有帮助 。
其他公司或顾客的资料:像是顾客在社交网站上的活动纪录 。就是企业即使花钱也想拿到的资料 。因为对自己很有用 。
公开资料:通常可以免费取得 。企业应该积极运用例如政府的公开资讯 。例如政府的公开资讯 。

推荐阅读