《数据挖掘之分类》的相关内容
相关讨论
数据挖掘之分类(kNN算法的描述及使用)
/**
*作者:张荣华
*日期:2008-2-23
**/
数据挖掘之分类系列文章
之前说到分类的基本概念以及一个文本分类的实例,原文地址见:http://www.javaeye.com/topic/163285 现在我们就来改造之前的分类算法,本文主要介绍KNN算法在文本分类器中的使用。
kNN算法简介:
kNN(k Nearest Neighbors)算法又叫k最临近方法 ...
by ahuaxuan 2008-02-23 浏览 (1183) 回复 (0) 关键字:
相关博客
相关圈子讨论
模糊搜索
如题,比如我索引的文字有两个document 1:爱的敬意 2:爱的致意 如果我想输入 爱的敬意 两条Document都能搜到,应该怎么做呢
by zhjt_88@163.com 2008-07-07 浏览 (158) 回复 (2)
使用MMAnalyzer 搜索出现一些问题
最近新学了LUCENE 发现MMAnalyzer分词后有好多英文没办法查出,不知道是不是所说的stop word ,如果是那应该怎么做才能让它在分词时保留那些单词,以下是我代码,请大家看看有什么方法能查到结果,当然将new MMAnalyzer改成SimpleAnalyzer是能搜索出来的,除此还有其他方式没,
package ch2.lucenedemo.test;
import ja ...
by zhanjianhua 2008-07-11 浏览 (306) 回复 (2)
lucene建立索引的错误,各位帮忙看看
前面打印的部分是显示从Google获取的内容,可以正常显示,现在要对这些内容进行索引,但在搜索过程总是显示java.lang.IndexOutOfBoundsException: Not a valid hit number: 0,看来是索引建立好,请大家帮忙看看
//开始建立索引
int j = 0;
while (j < 10) {
gs.setStartResul ...
by jaie 2008-04-06 浏览 (326) 回复 (4)
报告庖丁2.01停用词的Bug
x-noise-charactor.dic里的单独的停用词没有建立索引,但是x-noise-word.dic里的停用词都建到索引里去了。代码如下,对“但是,的”建立索引,搜索“的”没有结果,但搜索停用词“但是”得到一个结果。
package textss;
import net.paoding.analysis.analyzer.PaodingAnalyzer;
import net.pao ...
by guoyi 2007-09-12 浏览 (791) 回复 (2)
lucene Highlighter2.0做高亮显示中文时遇到的奇怪问题
高亮显示的中文不见了!!!!
比如:中华人民共和国
搜索:中华
却得到了 人民共和国,中华不见了!
我用的lucene 2.2.0 + highlighter2.0,中文分词是:org.mira.lucene.analysis.IK_CAnalyzer()
代码片段如下:
TermPositionVector tpv ;
String fragmentSeparator = ".. ...
by baidongli 2008-05-09 浏览 (382) 回复 (0)
相关新闻
基于Spindle的增强HTTP Spider
构建于lucene之上的可用的Java开源Spider少之又少,spindle长期没有更新且功能不够完善,故而自己参考其源
代码重新编写了一个可扩展的WebCrawler,本着开源共享,共同进步的想法发布于此,期冀得到大家的批评指正,
有任何意见及建议均可Email联系我(kaninebruno@hotmail.com)
以下代码基于lucene-2.3.1,htmlparser-1.6, ...
by brunoplum 2008-04-01 浏览 (1598) 回复 (7) 关键字: spindle
基于JavaScript的代码自动生成工具
JavaScript Based Code Generator - codegen 工具主页http://sourceforge.net/projects/jbcgen/目的快速生成程序代码, 比如Struts, Spring, Jdbc/Hibernate所有前后台的代码.简单介绍本工具生成代码的思想是读取数据库中表的结构, 使用JavaScript作为脚本语言编写模板, 生成各种代码或者文件, ...
by jejwe 2008-03-06 浏览 (3283) 回复 (2) 关键字:
javapolis举行的关于JAVA7语言特性投票的结果
上周javapolis举行了一次关于JAVA7中可能支持的语言特性的投票,该投票涉及到十中JAVA7
中可能的语法增强(这里不包括闭包,后面将单独列出).对于每种语法特性你需要回答"Do you
support this language change?",答案可以是"YES","NO","Maybe"三者之一.
下面罗列出这十种语法特性以及投票结果:
1.Property declaratio ...
by Eastsun 2007-12-18 浏览 (4733) 回复 (23) 关键字: java7

