文章插图
大数据并不在于其大 。而在于质量 。用通俗的话说就是有用 。
大数据是一个比较泛的概念 。大数据其实不是强调数据有多么大 。而是有用 。有用的数据才能称得上是大数据 。有用就包括了规模、质量等各种综合性属性 。
所有的数据都必须深度地与业务揉合 。换句话说 。创业者凭空想象的大数据模式一定都是虚假的 。没有做过这个具体业务的人去谈合作 。说如何帮到别人 。这都是忽悠 。
【大数据是什么,是怎么带动经济发展的?】这个行业里有太多不可描述的事情 。靠这个忽悠吃饭的人太多了 。大数据领域 。精准营销是一个被提及到最多的概念 。没有之一 。理论是大数据可以支持精准营销 。大家都知道大数据需要规模 。所有外行人看到的就是 。你有这么多数据 。所以你这个就是精准营销 。但是忽视了一点就是 。真正到精准营销前还有一个在中间隔着的 。不是规模而是质量 。而最终落地在效果 。
这里面大家很容易忽视一点 。就是大数据要做到支持精准营销 。这里面对大数据是有约定的 。数据的质量和规模同比都能达到的情况下 。才可以实现 。
其他观点:
大数据时代的生活令人向往 。你对客观世界的认识更进一步 。所做的决策也不再仅仅依赖主观判断 。基于你的一个习惯动作、你的一次消费行为、你的一份就诊记录 。都在被巨大的数字网络串联起来 。
《大数据时代:生活、工作与思维的大变革》一书的作者维克托·迈尔·舍恩伯格如是说:“如果你是一个个人 。如果你拒绝的话 。可能会失去生命 。如果是一个国家的话 。拒绝大数据时代的话 。可能失去这个国家的未来 。失去一代人的未来 。”
了解大数据、如何利用巨量资料 。成为人人关心的重点议题 。对于大数据的定义现在没有统一的定论 。但身处大数据领域里的人都同意一点:大数据绝不仅仅是指更多资料而已 。
【怎么利用信息技术等手段处理非结构化和半结构化数据】
大数据=结构化数据+非结构化数据
大数据中 。结构化数据只占15% 左右 。其余的85% 都是非结构化的数据 。它们大量存在于社交网络、互联网和电子商务等领域 。另一方面 。也许有90% 的数据来自开源数据 。其余的被存储在数据库中 。大数据的不确定性表现在高维、多变和强随机性等方面 。股票交易数据流是不确定性大数据的一个典型例子 。
大数据刺激了大量研究问题 。非结构化和半结构化数据的个体表现、一般性特征和基本原理尚不清晰 。这些都需要通过包括数学、经济学、社会学、计算机科学和管理科学在内的多学科交叉来研究和讨论 。给定一种半结构化或非结构化数据 。比如图像 。如何把它转化成多维数据表、面向对象的数据模型或者直接基于图像的数据模型?值得注意的是 。大数据每一种表示形式都仅呈现数据本身的侧面表现 。并非全貌 。
由于大数据所具有的半结构化和非结构化特点 。基于大数据的数据挖掘所产生的结构化的“粗糙知识”(潜在模式)也伴有一些新的特征 。这些结构化的粗糙知识可以被主观知识加工处理并转化 。生成半结构化和非结构化的智能知识 。寻求“智能知识”反映了大数据研究的核心价值 。
【大数据的4V特点】
大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(精确) 。网络的发展引起了信息量的飞速增长 。大数据技术的战略意义不在于掌握庞大的数据信息 。而在于对这些含有意义的数据进行专业化处理 。换言之 。如果把大数据比作一种产业 。那么这种产业实现盈利的关键 。在于提高对数据的“加工能力” 。通过“加工”实现数据的“增值”
。
【大数据与数据仓库、OLAP、数据挖掘技术的关系】
大数据技术指的是对大量信息进行专业处理、获取具有指导意义的信息以帮助决策的技术 。而数据仓库、OLAP(联机分析处理)、数据挖掘技术就是处理和分析“大数据”的主要方法 。也就是说 。实现大数据的分析和利用需要以数据仓库、OLAP、数据挖掘技术为手段 。
具体来说 。当海量数据摆在眼前 。针对用户可能关注的方面 。按照一定的主题域进行组织 。形成数据仓库;再通过联机分析处理(OLAP)对信息的多种可能的观察形式进行快速、稳定一致和交互性的存取 。形成多个维度的信息;再通过数据挖掘技术 。发现数据内部隐含的规律并展示给用户 。以指导用户决策 。关系图如下:
推荐阅读
- 体温计会不准吗
- 重大发现!印度失联月船2号着陆器月球表面被找到,印度方面能对它重建联系吗?
- 体温计打碎了会中毒吗
- 什么是“大数据”?有何运用前景?
- UFO真的存在吗?你相信有外星飞船经过吗?
- 体温计打碎了水银找不到了怎么办
- 大数据是什么意思,是否会泄露隐私?
- 水银掉地上多久蒸发完
- 互联网与大数据是什么关系?