永发信息网

如何用c#读取pdf内容

答案:1  悬赏:0  手机版
解决时间 2021-04-02 04:32
  • 提问者网友:低吟詩仙的傷
  • 2021-04-01 07:44
如何用c#读取pdf内容
最佳答案
  • 五星知识达人网友:愁杀梦里人
  • 2021-04-01 09:19
public static string ReadPdfContent(string filepath)
        {
            try
            {
                string pdffilename = filepath;
                PdfReader pdfReader = new PdfReader(pdffilename);
                int numberOfPages = pdfReader.NumberOfPages;
                StringBuilder text = new StringBuilder();
                for (int i = 1; i <= numberOfPages; ++i)
                {
                    text.Append(iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(pdfReader, i));
                }
                pdfReader.Close();
                return text.ToString();
            }
            catch (Exception ex)
            {
                return "原因:" + ex.ToString();
            }
        }此方法需要引用iTextSharp
也可以使用PDFBox
            PDDocument doc = PDDocument.load("lopreacamasa.pdf");
            PDFTextStripper pdfStripper = new PDFTextStripper();
            Console.Write(pdfStripper.getText(doc));
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯