永发信息网

JAVA poi 提取DOC文本框内容

答案:3  悬赏:80  手机版
解决时间 2021-02-06 22:21
  • 提问者网友:抽煙菂渘情少年
  • 2021-02-06 14:40
public static void main(String[] args) throws Exception
{
doc("doc/2.doc","image");
}
public static void doc(String docPath,String imgPath) throws Exception
{
FileInputStream in = new FileInputStream(docPath);
WordExtractor doc=new WordExtractor(in);
System.out.print(doc.getText());
in.close();
}

这段代码可以提取到纯文本,但是其他图片、文本框之类的,就显示不出来了。帮忙写个能提取到文本框中文字内容的,谢谢
最佳答案
  • 五星知识达人网友:十年萤火照君眠
  • 2021-02-06 14:58
似乎文本框的东西在range里,你这样直接拿拿不到
全部回答
  • 1楼网友:撞了怀
  • 2021-02-06 16:35
个人建议你去找一个API先看一下,DOC没做过,我只做过EXCL
  • 2楼网友:北方的南先生
  • 2021-02-06 15:40
参考代码如下: try { inputstream input = new fileinputstream("qa-textbox.xls"); poifsfilesystem fs = new poifsfilesystem(input); hssfworkbook wb = new hssfworkbook(fs); hssfsheet sheet = wb.getsheetat(0); hssfpatriarch pat = sheet.getdrawingpatriarch(); list children = pat.getchildren(); iterator it = children.iterator(); while(it.hasnext()) { hssfshape shape = (hssfshape)it.next(); if (shape instanceof hssftextbox){ //判断文本框 hssftextbox textbox = (hssftextbox)shape;//强转成textbox类型 hssfrichtextstring richstring = textbox.getstring(); //取值。。 string str = richstring.getstring(); system.out.println("string: " + str); system.out.println("string length: " + str.length()); } } } catch (ioexception ex) { ex.printstacktrace(); }
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯