公交车上荫蒂添的好舒服的电影-公用玩物(np双xing总受)-公用小荡货芊芊-公与妇仑乱hd-攻把受做哭边走边肉楼梯play-古装一级淫片a免费播放口

LOGO OA教程 ERP教程 模切知識(shí)交流 PMS教程 CRM教程 開發(fā)文檔 其他文檔  
 
網(wǎng)站管理員

【C#】利用免費(fèi)PdfPig庫讀取PDF并提取表格內(nèi)容保存為TXT文本文件代碼

admin
2025年2月20日 16:38 本文熱度 916

如果你需要完全免費(fèi)的 PDF 處理庫,可以考慮PdfPig方案:

  • 特點(diǎn):PdfPig 是一個(gè)開源的 .NET 庫,專注于讀取 PDF 文件內(nèi)容(包括文本、表格等)。

  • 許可證:Apache 2.0 許可證,完全免費(fèi),可用于商業(yè)項(xiàng)目。

  • GitHub 地址https://github.com/UglyToad/PdfPig

  • 適用場景:適合提取 PDF 中的文本和表格數(shù)據(jù)。

以下是一個(gè)使用 PdfPig 提取 PDF 表格并保存為 Excel 的示例代碼:

(1) 安裝 NuGet 包

Install-Package PdfPig

(2) 示例代碼

using System;

using System.Collections.Generic;

using System.IO;

using System.Linq;

using UglyToad.PdfPig;

using UglyToad.PdfPig.Content;

using OfficeOpenXml;

class Program

{

    static void Main(string[] args)

    {

        string pdfPath = "input.pdf";

        string excelPath = "output.xlsx";

        // 提取 PDF 中的表格數(shù)據(jù)

        var tableData = ExtractTableFromPdf(pdfPath);

        // 將表格數(shù)據(jù)保存為 Excel 文件

        SaveTableToText(tableData, excelPath);

        Console.WriteLine("PDF 表格已成功轉(zhuǎn)換為 Excel 文件。");

    }


    static List<List<string>> ExtractTableFromPdf(string pdfPath)

    {

        var tableData = new List<List<string>>();

        using (var pdfDocument = PdfDocument.Open(pdfPath))

        {

            foreach (var page in pdfDocument.GetPages())

            {

                var words = page.GetWords(); // 獲取頁面中的單詞

                var lines = words.GroupBy(w => w.BoundingBox.Bottom) // 按行分組

                                  .OrderByDescending(g => g.Key);

                foreach (var line in lines)

                {

                    var columns = line.OrderBy(w => w.BoundingBox.Left) // 按列排序

                                      .Select(w => w.Text)

                                      .ToList();

                    tableData.Add(columns);

                }

            }

        }

        return tableData;

    }


    static void SaveTableToText(List<List<string>> tableData, string excelPath)

    {

        for (int i = 0; i < tableData.Count; i++)

        {

            string tmpStr="";

            for (int j = 0; j < tableData[i].Count; j++)

            {

                tmpStr = tmpStr + "|" + tableData[i][j];

            }

            Console.WriteLine("----------------------");

            Console.WriteLine(tmpStr);

        }

    }

}

(3) 代碼說明

  • ExtractTableFromPdf:使用 PdfPig 提取 PDF 中的文本,并按行和列組織成表格數(shù)據(jù)。

  • SaveTableToExcel:使用 EPPlus 將表格數(shù)據(jù)保存為 Excel 文件。


效果說明:

下面是原始PDF文件樣式:

 下面是解碼結(jié)果:

 



總結(jié)

  • 如果你需要完全免費(fèi)的解決方案,推薦使用 PdfPig

  • 如果你需要更強(qiáng)大的功能,并且可以接受商業(yè)許可,可以選擇 iTextSharp 或 iText 7


該文章在 2025/2/20 16:43:20 編輯過
關(guān)鍵字查詢
相關(guān)文章
正在查詢...
點(diǎn)晴ERP是一款針對中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。
點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理,結(jié)合碼頭的業(yè)務(wù)特點(diǎn),圍繞調(diào)度、堆場作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體,是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。
點(diǎn)晴WMS倉儲(chǔ)管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲(chǔ)管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號管理軟件。
點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi),不限功能、不限時(shí)間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。
Copyright 2010-2025 ClickSun All Rights Reserved

主站蜘蛛池模板: 国产亚洲精品久久久一区 | 国产午夜亚洲一区二区在线观看 | 91精片一二三次 | 国产精品亚洲片夜色在线 | 国产精品无码电影在线观 | 国产女主播视频观看网站 | av无码久久久久不卡网站毛 | 国产人妻人伦精品无码.麻豆 | 国产成人免费ā片在线观看 | 国产精品麻豆三级一区视频 | 国产麻豆精品高清在线播放详情介绍 | av毛片无码中文字幕不卡 | 国产精品成人无码专区 | 国产区在线观看视频 | 成人av无码一区二区三区 | 精品日韩综合1区 | 国产丝袜一区二 | 91久久久久精品无嫩草影院 | 风韵丰满熟妇啪啪区老老熟妇 | 99久久国产精品欧美蜜芽 | 国产一区二区国产精品 | 激情内射人妻1区2区3区 | av区无码字幕中文色 | 国产午夜福利精品视频 | 91po国产在线精 | 国产成人猛男69精品视频 | 国产av无码专区国产乱码 | 国产一区二区三区四区五区视频 | 成人动漫免费看一区二区三区 | 国产av大学生第一次破 | 国产亚洲欧洲国产综合一区 | 福利视频一区二区三区 | 国产真人一级a爱视频免费看 | 国产精品猎奇系列在线观看 | 国产三级不卡靖品播放 | 国产日韩久久久久精品 | 国产福利一区二区麻豆 | 精品美女一级一区二区三 | 精品国产aⅴ一区二区三区 精品国产aⅴ一区二区三区4区 | 国产美女玩具在线观看 | 动漫av永久无码精品每日更新 |