数据挖掘的历史

在1990年代, 引入了“数据挖掘”一词, 但是数据挖掘是一个具有悠久历史的行业的发展。
识别数据模式的早期技术包括贝叶斯定理(1700年代)和回归演化(1800年代)。由于数据集的规模和复杂性水平很高, 因此计算机科学的产生和增长的力量促进了数据的收集, 存储和处理。显式动手数据调查已通过间接, 自动数据处理和其他计算机科学发现(例如神经网络, 聚类, 遗传算法(1950年代), 决策树(1960年代)和支持向量机(1990年代))得到了逐步改进。
数据挖掘的起源可追溯到三大家族:经典统计, 人工智能和机器学习。
古典统计:
统计是构建数据挖掘的大多数技术的基础, 例如回归分析, 标准偏差, 标准分布, 标准方差, 判别分析, 聚类分析和置信区间。所有这些都用于分析数据和数据连接。
人工智能:
人工智能或人工智能基于启发式而非统计。它试图将类似人类思想的处理应用于统计问题。一些高端的商业产品采用了特定的AI概念, 例如关系数据库管理系统(RDBMS)的查询优化模块。
机器学习:
【数据挖掘的历史】机器学习是统计和AI的结合。它可能被视为AI的发展, 因为它将AI启发式方法与复杂的统计分析相结合。机器学习试图使计算机程序知道他们正在研究的数据, 以便程序根据所检查数据的特征做出不同的决策。它使用基本概念的统计数据, 并添加更多的AI启发式方法和算法来实现其目标。

    推荐阅读