五分钟解读大数据 什么是大数据概念及特点( 三 )

  • Variety(多样化)
  • 数据的形式是多种多样的 , 包括数字(价格、交易数据、体重、人数等)、文本(邮件、网页等)、图像、音频、视频、位置信息(经纬度、海拔等) , 等等 , 都是数据 。
    数据又分为结构化数据和非结构化数据 。
    从名字可以看出 , 结构化数据 , 是指可以用预先定义的数据模型表述 , 或者 , 可以存入关系型数据库的数据 。

    五分钟解读大数据 什么是大数据概念及特点

    文章插图
    结构化数据
    例如 , 一个班级所有人的年龄、一个超市所有商品的价格 , 这些都是结构化数据 。
    而网页文章、邮件内容、图像、音频、视频等 , 都属于非结构话数据 。
    在互联网领域里 , 非结构化数据的占比已经超过整个数据量的80% 。
    大数据 , 就符合这样的特点:数据形式多样化 , 且非结构化数据占比高 。
    • Velocity(时效性)
    大数据还有一个特点 , 那就是时效性 。从数据的生成到消耗 , 时间窗口非常小 。数据的变化速率 , 还有处理过程 , 越来越快 。例如变化速率 , 从以前的按天变化 , 变成现在的按秒甚至毫秒变化 。
    我们还是用数字来说话:
    就在刚刚过去的这一分钟 , 数据世界里发生了什么?
    Email:2.04亿封被发出
    Google:200万次搜索请求被提交
    Youtube:2880分钟的视频被上传
    Facebook:69.5万条状态被更新
    Twitter:98000条推送被发出
    12306:1840张车票被卖出
    ……
    怎么样?是不是瞬息万变?
    • Value(价值密度)
    最后一个特点 , 就是价值密度 。
    大数据的数据量很大 , 但随之带来的 , 就是价值密度很低 , 数据中真正有价值的 , 只是其中的很少一部分 。
    例如通过监控视频寻找犯罪分子的相貌 , 也许几TB的视频文件 , 真正有价值的 , 只有几秒钟 。

    五分钟解读大数据 什么是大数据概念及特点

    文章插图
    2014年美国波士顿爆炸案 , 现场调取了10TB的监控数据(包括移动基站的通讯记录 , 附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料) , 最终找到了嫌疑犯的一张照片 。
    大数据的价值
    刚才说到价值密度 , 也就说到了大数据的核心本质 , 那就是价值 。
    人类提出大数据、研究大数据的主要目的 , 就是为了挖掘大数据里面的价值 。
    大数据 , 究竟有什么价值?
    早在1980年 , 著名未来学家阿尔文·托夫勒在他的著作《第三次浪潮》中 , 就明确提出:“数据就是财富” , 并且 , 将大数据称为“第三次浪潮的华彩乐章” 。

    五分钟解读大数据 什么是大数据概念及特点

    文章插图
    • 第一次浪潮:农业阶段 , 约1万年前开始
    • 第二次浪潮:工业阶段 , 17世纪末开始
    • 第三次浪潮:信息化阶段 , 20世纪50年代后期开始
    进入21世纪之后 , 随着前面所说的第二第三阶段的发展 , 移动互联网崛起 , 存储能力和云计算能力飞跃 , 大数据开始落地 , 也引起了越来越多的重视 。

    推荐阅读