浏览 335 次
|
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
|---|---|
| 作者 | 正文 |
|
时间:2007-10-16
public class WordUtil {
public static String readDoc(String file) throws Exception{
FileInputStream fis = new FileInputStream(file);
WordExtractor word = new WordExtractor();
String text = word.extractText(fis);
return text;
}
public static void main(String[] args) {
String file = "d:\\lucene.doc";
String txt = "";
try {
txt = readDoc(file);
} catch (Exception e) {
e.printStackTrace();
}
System.out.println(txt);
}
}
以上是我对word读取的代码,采用poi,textmining这几个包。 但报了一个字符串越界错误 java.lang.StringIndexOutOfBoundsException: String index out of range: -1738 at java.lang.AbstractStringBuilder.substring(AbstractStringBuilder.java:882) at java.lang.StringBuffer.substring(StringBuffer.java:417) at org.apache.poi.hwpf.model.TextPiece.substring(TextPiece.java:88) at org.textmining.text.extraction.WordExtractor.extractText(WordExtractor.java:179) at cn.safetybase.doc.WordUtil.readDoc(WordUtil.java:28) at cn.safetybase.doc.WordUtil.main(WordUtil.java:37) 声明:JavaEye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
|
|
| 返回顶楼 | |
|
时间:2008-05-16
我也遇到这样的问题,
当把文档内容减少就不会了 郁闷!! doc文档一般都是很大的, 该怎么解决叫 |
|
| 返回顶楼 | |


