浏览 242 次
|
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
|---|---|
| 作者 | 正文 |
|
时间:2008-01-15
我刚学lucene,写了个小程序来搜索一个800k大小的文件a。问题是:
假如 "baitian" 这个词放在文件的前部,大约是在80k大小以前的位置,可以被搜索到,
而如果将这个词放到文件的尾部,则搜索不到,为什么?
(在文件a中“baitian” 只出现一次,并且作为一个单词被分词器辨别)。 声明:JavaEye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
|
|
| 返回顶楼 | |
|
时间:2008-01-16
找了很久,还是没头绪,有没有人能提示一下问题可能的方向
|
|
| 返回顶楼 | |
|
时间:2008-01-17
Lucene将长文本无声无息的帮你截掉了,
在IndexWriter里面你可以看到这样的代码 /** * Default value is 10,000. Change using {@link #setMaxFieldLength(int)}. */ public final static int DEFAULT_MAX_FIELD_LENGTH = 10000; |
|
| 返回顶楼 | |


