大数据是什么?我们生活中的哪些方面属于大数据范畴?


美国NASA如何能提前预知各种天文奇观?风力发电机和创业者开店如何选址?如何才能准确预测并对气象灾害进行预警?包括在未来的城镇化建设过程中 。如何打造智能城市?等等 。这一系列问题的背后 。其实都隐藏着大数据的身影——不仅彰显着大数据的巨大价值 。更直观地体现出大数据在各个行业的广阔应用 。这些行业应用也都更直白地告诉人们 。什么是大数据……
其实 。大数据不是突然出现的 。在过去的几十年间 。数学分析就已经涉猎金融行业了 。诺贝尔经济学奖获得者哈里.马克维茨、威廉.夏普、罗伯特.恩格尔就是利用计量经济学知识和金融市场数据来建立数学模型 。预测金融市场产品收益同风险波动的关系 。
大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果 。确切的说是移动互联网、物联网产生了海量的数据 。大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题 。
当我们最初谈大数据的时候 。谈的最多的可能是用户行为分析 。即通过各种用户行为 。包括浏览记录 。消费记录 。交往和购物娱乐 。行动轨迹等各种用户行为产生的数据 。由于这些数据本身符合海量 。异构的特征 。同时通过分析这些数据之间的关联性容易匹配某些结果现象 。即有一堆的行为因子x 。同时又有一堆的结果构成y 。我们找寻到了某种相关性 。有利于我们调整后续的各种策略 。
为何Google能够做大数据?你思考过吗?因为搜索本身往往是用户行为的一个重要入口 。即搜索引擎具备了实时采集多个用户行为的x因子的能力 。搜索引擎做大数据的弱势在哪里?即前面谈到的用户和用户之间的关系较难建立 。而更多是本身行为之间的相关性 。从这个差异上也可以看到搜索引擎更加容易做交通 。疾病 。气象等方面的大数据分析和预测 。
对于大数据的应用场景 。包括各行各业对大数据处理和分析的应用 。最核心的还是用户需求 。接下来 。本文通过梳理各个行业在大数据应用领域面临的挑战、如何寻找突破口来展示其潜在存在的大数据应用场景 。
一、医疗大数据看病更高效
除了较早前就开始利用大数据的互联网公司 。医疗行业是让大数据分析最先发扬光大的传统行业之一 。医疗行业拥有大量的病例 。病理报告 。治愈方案 。药物报告等等 。如果这些数据可以被整理和应用将会极大地帮助医生和病人 。我们面对的数目及种类众多的病菌、病毒 。以及肿瘤细胞 。其都处于不断的进化的过程中 。在发现诊断疾病时 。疾病的确诊和治疗方案的确定是最困难的 。
在未来 。借助于大数据平台我们可以收集不同病例和治疗方案 。以及病人的基本特征 。可以建立针对疾病特点的数据库 。如果未来基因技术发展成熟 。可以根据病人的基因序列特点进行分类 。建立医疗行业的病人分类数据库 。在医生诊断病人时可以参考病人的疾病特征、化验报告和检测报告 。参考疾病数据库来快速帮助病人确诊 。明确定位疾病 。在制定治疗方案时 。医生可以依据病人的基因特点 。调取相似基因、年龄、人种、身体情况相同的有效治疗方案 。制定出适合病人的治疗方案 。帮助更多人及时进行治疗 。同时这些数据也有利于医药行业开发出更加有效的药物和医疗器械 。
医疗行业的数据应用一直在进行 。但是数据没有打通 。都是孤岛数据 。没有办法进行大规模应用 。未来需要将这些数据统一收集起来 。纳入统一的大数据平台 。为人类健康造福 。政府和医疗行业是推动这一趋势的重要动力 。
二、生物大数据改良基因
自人类基因组计划完成以来 。以美国为代表 。世界主要发达国家纷纷启动了生命科学基础研究计划 。如国际千人基因组计划、DNA百科全书计划、英国十万人基因组计划等 。这些计划引领生物数据呈爆炸式增长 。目前每年全球产生的生物数据总量已达EB级 。生命科学领域正在爆发一次数据革命 。生命科学某种程度上已经成为大数据科学 。
我们来看看今天的准妈妈们 。除了要准备尿布、奶瓶和婴儿装 。她们还会把基因测试列入计划单 。基因测试能让未来的父母对于他们未出生的baby的健康有更多的了解 。对基因携带者筛查和胚胎植入前诊断 。使一个家庭孕育小孩的过程产生了巨大改变 。
当下 。我们所说的生物大数据技术主要是指大数据技术在基因分析上的应用 。通过大数据平台人类可以将自身和生物体基因分析的结果进行记录和存储 。利用建立基于大数据技术的基因数据库 。大数据技术将会加速基因技术的研究 。快速帮助科学家进行模型的建立和基因组合模拟计算 。基因技术是人类未来战胜疾病的重要武器 。借助于大数据技术的应用 。人们将会加快自身基因和其它他生物的基因的研究进程 。未来利用生物基因技术来改良农作物 。利用基因技术来培养人类器官 。利用基因技术来消灭害虫都即将实现 。

推荐阅读