论坛首页 入门讨论版 Java

POI对word的读取

浏览 335 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
时间:2007-10-16


public class WordUtil {

	public static String readDoc(String file) throws Exception{
		FileInputStream fis = new FileInputStream(file);
		WordExtractor word = new WordExtractor();
		String text = word.extractText(fis);
		return text;
	}
	
	
	public static void main(String[] args) {
		String file = "d:\\lucene.doc";
		String txt = "";
		try {
			txt = readDoc(file);
		} catch (Exception e) {
			e.printStackTrace();
		}
		System.out.println(txt);
	}
	
}


以上是我对word读取的代码,采用poi,textmining这几个包。
但报了一个字符串越界错误

java.lang.StringIndexOutOfBoundsException: String index out of range: -1738
	at java.lang.AbstractStringBuilder.substring(AbstractStringBuilder.java:882)
	at java.lang.StringBuffer.substring(StringBuffer.java:417)
	at org.apache.poi.hwpf.model.TextPiece.substring(TextPiece.java:88)
	at org.textmining.text.extraction.WordExtractor.extractText(WordExtractor.java:179)
	at cn.safetybase.doc.WordUtil.readDoc(WordUtil.java:28)
	at cn.safetybase.doc.WordUtil.main(WordUtil.java:37)

   
时间:2008-05-16
我也遇到这样的问题,
当把文档内容减少就不会了
郁闷!!
doc文档一般都是很大的,
该怎么解决叫
   
0 请登录后投票
论坛首页 入门讨论版 Java

跳转论坛:
JavaEye推荐