数据又分为结构化数据和非结构化数据 。
从名字可以看出 , 结构化数据 , 是指可以用预先定义的数据模型表述 , 或者 , 可以存入关系型数据库的数据 。
文章插图
结构化数据
例如 , 一个班级所有人的年龄、一个超市所有商品的价格 , 这些都是结构化数据 。
而网页文章、邮件内容、图像、音频、视频等 , 都属于非结构话数据 。
在互联网领域里 , 非结构化数据的占比已经超过整个数据量的80% 。
大数据 , 就符合这样的特点:数据形式多样化 , 且非结构化数据占比高 。
- Velocity(时效性)
我们还是用数字来说话:
就在刚刚过去的这一分钟 , 数据世界里发生了什么?
Email:2.04亿封被发出
Google:200万次搜索请求被提交
Youtube:2880分钟的视频被上传
Facebook:69.5万条状态被更新
Twitter:98000条推送被发出
12306:1840张车票被卖出
……
怎么样?是不是瞬息万变?
- Value(价值密度)
大数据的数据量很大 , 但随之带来的 , 就是价值密度很低 , 数据中真正有价值的 , 只是其中的很少一部分 。
例如通过监控视频寻找犯罪分子的相貌 , 也许几TB的视频文件 , 真正有价值的 , 只有几秒钟 。
文章插图
2014年美国波士顿爆炸案 , 现场调取了10TB的监控数据(包括移动基站的通讯记录 , 附近商店、加油站、报摊的监控录像以及志愿者提供的影像资料) , 最终找到了嫌疑犯的一张照片 。
大数据的价值
刚才说到价值密度 , 也就说到了大数据的核心本质 , 那就是价值 。
人类提出大数据、研究大数据的主要目的 , 就是为了挖掘大数据里面的价值 。
大数据 , 究竟有什么价值?
早在1980年 , 著名未来学家阿尔文·托夫勒在他的著作《第三次浪潮》中 , 就明确提出:“数据就是财富” , 并且 , 将大数据称为“第三次浪潮的华彩乐章” 。
文章插图
- 第一次浪潮:农业阶段 , 约1万年前开始
- 第二次浪潮:工业阶段 , 17世纪末开始
- 第三次浪潮:信息化阶段 , 20世纪50年代后期开始
推荐阅读
- 鲁智深坐化有什么疑点?
- 支付宝蚂蚁庄园蹭饭卡怎么使用_蚂蚁庄园蹭饭卡使用攻略
- 黄皮果含糖分高吗
- 东阿县景点
- uv打印机打印产品成本是怎样计算的?
- UGNX特征建模中的方法
- 近水楼台先得月,下一句是什么?这两句蕴含的道理是什么?
- 卖二手手机哪个平台好
- 黄皮果核怎么吃