weka聚类分析代码,基于weka的聚类分析实验报告

如何将自己的算法添加到weka如何通过weka构建决策树提取分类规则?要使用聚类-3/,如何将各种分类算法与-0集成,需要将文件转换成标称类型,weka将exel中的数字作为数据类型处理,无法处理,因此想请教matlab,weka哪两个软件...weka都是专业的数据挖掘软件,你可以用它的算法 , 也可以自己写Java算法 。

1、如何使用JavaWeka开源项目,实现J48决策树、支持向量机算法,在10个UCI...publicstaticvoidRegular()throwsException {(F:_ train . ARFF);arffloaderloaderneworffloader();loader . set);instancesinstrainloader . get dataset();instrain . setclassindex(instrain . num attributes()1);输入(F:_ test . ARFF);loader . set);instanceinstestloader . get dataset();instest . setclassindex(instest . num attributes()1);doublesuminstest . num instances();intright0classifierclasnewj 48();//Classifierclasnewweka. classifiers . Bayes . Bayes net();class . build classifier(insTrai .

2、是用python学数据挖掘好,还是用java学 weka的开发好主要是方便 。python的第三方模块丰富,语法非常简洁,自由度非常高 。python的numpy、scipy和matplotlib模块可以完成spss的所有功能,并且可以根据自己的需要对数据进行清理和归约 。如果有必要,他们还可以连接sql做机器学习 。很多时候,数据是由网络爬虫从互联网上收集的 。python有一个urllib模块,可以轻松完成这个任务 。有时候爬虫在收集数据的时候要处理一些网站的验证码 。python有一个PIL模块,很容易识别 。如果需要神经网络和遗传算法,scipy也可以完成这项任务 。还有决策树比如代码 ifthen,和聚类不能局限于某些种类聚类,可能需要根据实际情况进行调整,kmeans 聚类,dbscan 。有时候可能需要结合两个聚类方法对大规模数据进行聚类 分析 , 这些都需要自己编码 。此外,还有很多基于距离的距离表达方法,如欧氏距离、余弦距离、闵可夫斯基距离、城市街区距离等 。

3、如何在 weka中加入自己的算法 4、通过 weka建立决策树怎么提取分类规则?是指从训练好的决策树模型中自动提取分类规则吗?weka好像没有直接从树形结构中提取规则的功能 。但是如果模型不是太复杂,手工统计从根节点到叶节点的每一次遍历也是非常方便的 。每次遍历上的内部节点加分支是if条件,叶子节点是then的判断结果 。如果模型比较复杂,可以考虑简单的二次开发 。假设您使用J48 , 
【weka聚类分析代码,基于weka的聚类分析实验报告】
5、我在做文本数据挖掘,要用到 聚类 分析,想请问matlab、 weka这两款软件哪... weka是一款专业的数据挖掘软件 。你可以用它的算法,也可以自己写Java算法 。数据量小的话可以用Weka,还有Spss或者Sas 。数据量大的话可以考虑Matlab 。Excel VBA编程方法可以完成“system 聚类”的全过程:从“数据输入”到“家谱绘制”,已经有人解决了,可以方便简单的实现 。如果只指软件本身,显然是weka , 至少有这方面的功能模块 。
另外,这两款软件都可以添加函数库 。相对来说,weka只能用java添加,步骤比较麻烦 。在matlab中添加工具箱很简单,容易引用,但是用matlab做这个研究的人估计很少,所以应该很难找到相关资源 。如果你专攻这个,你应该找其他的软件 。当然,如果你做研究 , 深入到具体的算法,还是一个数学问题,可以在matlab下处理 。
6、如何用 weka将多种分类算法集成起来该文件需要转换为名义类型 。wekaExel中的数字被视为数据类型,无法处理,导致Apriori算法不可用 。WEKA的全称是Waikato Intelligent分析Environment for Knowledge Analysis,weka也是新西兰的鸟名,WEKA的主要开发者来自新西兰 。wekaWEKA作为一部开放的数据挖掘作品 , 收集了大量能够承担数据挖掘任务的机器学习算法,包括数据预处理、分类、回归、聚类、关联规则以及在新的交互界面上的可视化 。
在weka中集成自己的算法甚至使用它的方法来实现自己的可视化工具并不难 。2005年8月,在第11届ACMSIGKDD国际会议上,怀卡托大学的Weka团队获得了数据挖掘和知识探索领域的最高服务奖,Weka系统得到了广泛的认可,被认为是数据挖掘和机器学习史上的里程碑,是最完备的数据挖掘工具之一(已有11年的历史) 。

    推荐阅读