本文概述
- 1.橙色数据挖掘
- 2. SAS数据挖掘
- 3. DataMelt数据挖掘
- 4.摇铃
- 5.快速矿工
文章图片
数据挖掘工具的目的是在大型数据集中发现模式/趋势/分组, 并将数据转换为更精细的信息。
它是一个框架, 例如Rstudio或Tableau, 可让你执行不同类型的数据挖掘分析。
我们可以对你的数据集执行各种算法, 例如聚类或分类, 并可视化结果本身。它是一个框架, 可为我们提供有关数据和数据表示现象的更好的见解。这样的框架称为数据挖掘工具。
数据挖掘市场工具令人眼前一亮:根据ReortLinker的最新报告指出, 到2023年, 该市场的销售额将突破10亿美元, 高于2018年的5.91亿美元
这些是最受欢迎的数据挖掘工具:
文章图片
1.橙色数据挖掘
文章图片
Orange是完美的机器学习和数据挖掘软件套件。它支持可视化, 并且是基于软件的软件, 该软件使用Python计算语言编写, 并由斯洛文尼亚卢布尔雅那大学计算机与信息科学学院的生物信息学实验室开发。
由于Orange是基于组件的软件, 因此Orange的组件称为“小部件”。这些小部件的范围从预处理和数据可视化到算法评估和预测建模。
小部件提供了重要的功能, 例如:
- 显示数据表并允许选择功能
- 资料读取
- 训练预测变量和学习算法的比较
- 数据元素可视化等
为什么是橙色?
变为橙色的数据会快速格式化为所需的模式, 并且可以在需要时轻松地移动小部件。橙色对于用户来说非常有趣。 Orange通过快速比较和分析数据使用户可以在短时间内做出更明智的决策, 这是一个很好的开源数据可视化以及评估, 适用于初学者和专业人士。数据挖掘可以通过可视化编程或Python脚本执行。通过其可视化编程界面(与小部件拖放连接)可以进行许多分析, 并且倾向于支持许多可视化工具, 例如条形图, 散点图, 树, 树状图和热图。倾向于支持大量的小部件(超过100个)。
该仪器具有机器学习组件, 用于生物信息学和文本挖掘的附加组件, 并且具有用于数据分析的功能。这也用作python库。
文章图片
Python脚本可以在终端窗口, PyCharmand PythonWin之类的集成环境, iPython之类的pr shell中继续运行。 Orange由画布界面组成, 用户可以在其上放置小部件并创建数据分析工作流。该小部件提出了一些基本操作, 例如, 读取数据, 显示数据表, 选择功能, 训练预测变量, 比较学习算法, 可视化数据元素等。Orange在Windows, Mac OS X和各种Linux操作系统上运行。 Orange带有多种回归和分类算法。
Orange可以读取本机和其他数据格式的文档。 Orange致力于用于分类或监督数据挖掘的机器学习技术。分类中使用两种类型的对象:学习者和分类器。学习者考虑按类划分的数据并返回分类器。回归方法与Orange中的分类非常相似, 两者均设计用于监督数据挖掘, 并且需要类级别的数据。合奏的学习结合了各个模型的预测以实现精确增益。该模型可以来自不同的训练数据, 也可以对同一组数据使用不同的学习者。
通过更改他们的参数集, 学习者也可以多样化。橘色的合奏只是学习者的包装。他们的行为就像其他学习者一样。他们根据数据返回可以预测任何数据实例结果的模型。
2. SAS数据挖掘
文章图片
SAS代表统计分析系统。它是SAS Institute为分析和数据管理而创建的产品。 SAS可以挖掘, 更改数据, 管理来自各种来源的信息以及分析统计信息。它为非技术用户提供了图形用户界面。
SAS数据挖掘器使用户能够分析大数据并提供准确的见解, 以便及时做出决策。 SAS具有高度可扩展的分布式内存处理体系结构。它适用于数据挖掘, 优化和文本挖掘。
3. DataMelt数据挖掘
文章图片
DataMelt是一个计算和可视化环境, 它提供了用于数据分析和可视化的交互式结构。它主要是为学生, 工程师和科学家设计的。也称为DMelt。
DMelt是用JAVA编写的多平台实用程序。它可以在与JVM(Java虚拟机)兼容的任何操作系统上运行。它由科学和数学库组成。
- 科学库:科学库用于绘制2D / 3D图。
- 数学库:数学库用于随机数生成, 算法, 曲线拟合等。
4.摇铃
文章图片
Ratte是基于GUI的数据挖掘工具。它使用R stats编程语言。 Rattle通过提供重要的数据挖掘功能来揭示R的静态能力。拨浪鼓虽然具有全面且完善的用户界面, 但具有集成的日志代码选项卡, 该选项卡可为任何GUI操作生成重复代码。
可以查看和编辑Rattle产生的数据集。 Rattle提供了另一种功能来查看代码, 将其用于许多目的并扩展代码而没有任何限制。
5.快速矿工
文章图片
Rapid Miner是公司创建的, 与Rapid Miner同名的最受欢迎的预测分析系统之一。它是用JAVA编程语言编写的。它提供了用于文本挖掘, 深度学习, 机器学习和预测分析的集成环境。
该仪器可用于多种应用, 包括公司应用, 商业应用, 研究, 教育, 培训, 应用开发, 机器学习。
【数据挖掘工具】Rapid Miner可在现场以及公共或私有云基础架构中提供服务器。它以客户端/服务器模型为基础。快速矿工随附基于模板的框架, 该框架可实现快速交付而几乎没有错误(通常在手动编码编写过程中会出现这种情况)