ext + struts1.2 + torque》的相关内容

文档内容提取的实现(支持Word,PowerPoint,Excel,Pdf等)

我们在做搜索引擎时,经常会碰到需要读取包括Word,Excel,PDF等格式文件内容来建立索引,其实借助开源的POI等框架,我们很容易的能实现这一点,建立索引的时候要特别注意中文分词(可以使用中科院的那个开源分词算法),很简单,读取Word的代码片段如下: public static String getWordDocument(String filepath) { StringBuff ...
by kongshanxuelin 2008-09-18 浏览 (92) 回复 (1) 关键字:

赞助商链接