大数据是什么意思

简要回答
大数据是传统软件工具无法在一定时间范围内捕获、管理和处理的数据集合 。它是一种海量、高增长、多样化的信息资产,需要一种新的处理模式来具备更强的决策、洞察和发现以及流程优化能力 。
“大数据”是现在出现频率非常高的一个词 。大家都说现在是大数据时代 。你知道大数据真正意味着什么吗?让我们和你谈谈吧 。
详细内容
大数据,一个IT行业术语,指的是在一定时间范围内无法被传统软件工具捕获、管理和处理的数据集合 。它是一种海量、高增长、多样化的信息资产,需要一种新的处理模式来具备更强的决策、洞察和发现以及流程优化能力 。在维克多·迈耶-勋伯格和肯尼斯·库克耶撰写的《大数据时代》中,大数据意味着所有数据都被用于分析和处理,而不是像随机分析(抽样调查)这样的捷径 。大数据的5V特性(IBM提出):量、速、变、值、准 。
02
麦肯锡全球研究所给出的定义是:一种数据集合,其规模之大,在获取、存储、管理和分析等方面大大超出了传统数据库软件工具的能力 。它有四个特点:数据规模大、数据流快、数据类型多样、价值密度低 。
03
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业化处理 。换句话说,如果把大数据比作一个行业,这个行业盈利的关键在于提高数据的“处理能力”,通过“处理”实现数据的“增值” 。从技术上讲,大数据和云计算的关系就像硬币的正反面一样密不可分 。大数据不能由单台计算机处理,必须采用分布式架构 。它的特点是对海量数据进行分布式数据挖掘 。但它必须依靠云计算的分布式处理、分布式数据库、云存储和虚拟化技术 。
【大数据是什么意思】04
随着云时代的到来,大数据越来越受到人们的关注 。根据该团队的说法,大数据通常用于描述公司创建的大量非结构化数据和半结构化数据,当下载到关系数据库进行分析时,会花费太多的时间和金钱 。大数据分析经常与云计算联系在一起,因为对大数据集的实时分析需要像MapReduce这样的框架来将工作分配到几十台、几百台甚至几千台计算机上 。大数据需要特殊的技术来有效地处理容差时间内的大量数据 。适用于大数据的技术包括MPP数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展存储系统 。的最小基本单位是位,所有单位按顺序给出:位、字节、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB 。
05
大数据包括结构化、半结构化和非结构化数据,非结构化数据正日益成为数据的主要部分 。根据IDC的调查报告,企业中80%的数据是非结构化数据,这些数据每年以指数级的速度增长60% 。大数据只是互联网发展到现阶段的一种表征或特征,没有必要对其神话或保持敬畏 。在以云计算为代表的技术创新背景下,这些原本看似难以收集和使用的数据,却可以轻松利用 。通过各行各业的不断创新,大数据将逐渐为人类创造更多价值 。
06
当今社会是一个发展迅速、科技先进、信息流通、人与人之间交流更加密切、生活更加便利的社会 。大数据是这个高科技时代的产物 。阿里巴巴创始人马云在台湾演讲中提到,未来的时代不会是IT时代,而是DT时代,也就是Data Technology,可见大数据对于阿里巴巴集团的重要作用 。有些人把数据比作含有能量的煤矿 。根据煤的性质,将炼焦煤、无烟煤、肥煤、贫煤等进行分类,而露天煤矿和深山煤矿的掘进成本是不同的 。同样,大数据不是“大”而是“有用” 。价值和开采成本比数量更重要 。对于很多行业来说,如何利用这些大规模的数据是赢得竞争的关键 。

    推荐阅读