最近在搞文本挖掘做东西,下的sas里这个模块用不了,只好找了weka来用。这里是weka的最新版本与各位分享了。附上我找的英文手册和中文简单介绍。
中文说明太少了,各位要用的话还要多摸索。
这个weka网站可以找到资料:http://weka.wikispaces.com/
WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis)。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。
WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。
如果想自己实现数据挖掘算法的话,可以看一看weka的接口文档。在weka中集成自己的算法甚至借鉴它的方法自己实现可视化工具并不是件很困难的事情。
貌似这是我注册以来的处女贴啊。。。