五分钟解读大数据 什么是大数据概念及特点( 二 )


文章插图
普通硬盘
1PB , 需要大约2个机柜的存储设备 。容量大约是2亿张照片或2亿首MP3音乐 。如果一个人不停地听这些音乐 , 可以听上千年 。。。

五分钟解读大数据 什么是大数据概念及特点

文章插图
2个机柜
1EB , 需要大约2000个机柜的存储设备 。如果并排放这些机柜 , 可以连绵1.2公里那么长 。如果摆放在机房里 , 需要21个标准篮球场那么大的机房 , 才能放得下 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
21个篮球场
阿里、百度、腾讯这样的互联网巨头 , 数据量据说已经接近EB级 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
阿里数据中心内景
EB还不是最大的 。目前全人类的数据量 , 是ZB级 。
1 ZB = 1024 EB (ZB – zettabyte)
2011年 , 全球被创建和复制的数据总量是1.8ZB 。
而到2020年 , 全球电子设备存储的数据 , 将达到35ZB 。如果建一个机房来存储这些数据 , 那么 , 这个机房的面积将比42个鸟巢体育场还大 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
数据量不仅大 , 增长还很快——每年增长50% 。
目前的大数据应用 , 还没有达到ZB级 , 主要集中在PB/EB级别 。
大数据的级别定位
1 KB = 1024 B (KB – kilobyte)
1 MB = 1024 KB (MB – megabyte)
1 GB = 1024 MB (GB – gigabyte)
1 TB = 1024 GB (TB – terabyte)
1 ZB = 1024 EB (ZB – zettabyte)
数据的来源
数据的增长 , 为什么会如此之快?
说到这里 , 就要回顾一下人类社会数据产生的几个重要阶段 。
大致来说 , 是三个重要的阶段 。
第一个阶段 , 就是计算机被发明之后的阶段 。尤其是数据库被发明之后 , 使得数据管理的复杂度大大降低 。各行各业开始产生了数据 , 从而被记录在数据库中 。这时的数据 , 以结构化数据为主(待会解释什么是“结构化数据”) 。数据的产生方式 , 也是被动的 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
世界上第一台通用计算机-ENIAC
第二个阶段 , 是伴随着互联网2.0时代出现的 。互联网2.0的最重要标志 , 就是用户原创内容 。随着互联网和移动通信设备的普及 , 人们开始使用博客、facebook、youtube这样的社交网络 , 从而主动产生了大量的数据 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
第三个阶段 , 是感知式系统阶段 。随着物联网的发展 , 各种各样的感知层节点开始自动产生大量的数据 , 例如遍布世界各个角落的传感器、摄像头 。

五分钟解读大数据 什么是大数据概念及特点

文章插图
经过了“被动-主动-自动”这三个阶段的发展 , 最终导致了人类数据总量的极速膨胀 。
大数据的4Vs
行业里对大数据的特点 , 概括为4个V 。前面所说的庞大数据体量 , 就是Volume(海量化) 。除了Volume之外 , 剩下三个 , 分别是Variety、Velocity、Value 。
我们一个一个来介绍 。