PDF 转 Excel工具
在线把 PDF里的表格转成可编辑的 Excel(.xlsx)文件。逐页提取文字流,按行/列坐标自动推断表格结构,一键下载多 sheet 工作簿。完全浏览器端本地处理,文件不上传服务器。
工具介绍 / About PDF to Excel
PDF 转 Excel 是 DevToolbox 提供的一款免费在线工具,专门解决"PDF表格搬运到 Excel"的痛点。财务报表、发票清单、成绩单、库存表、销售数据……只要 PDF里的表格是可选中文字(非扫描图片),本工具就能逐页解析文字流、按 y坐标分行、按 x坐标分列,自动重建为 .xlsx 中的二维单元格阵列。每一页 PDF单独生成一个 sheet(命名为 Page1 / Page2 / Page3 ……),方便后续在 Excel 里分页查看与二次加工。整个流程完全运行在你的浏览器中——文件不上传任何服务器,无需注册、无水印、无次数限制,最大支持50 MB 的 PDF。底层采用 pdf.js (pdfjs-dist4.0.379)提取文本,SheetJS (xlsx0.20.3) 生成工作簿,FileSaver触发下载,三大开源库 CDN 直连,加载完毕即可离线使用。 Unlike desktop converters that require Java / .NET runtime or paid SaaS上传 to their servers, this free online PDF to Excel converter runs entirely in your Chromium / Firefox / Safari tab — your financial statements, invoices and personal records never leave your device, satisfying GDPR / 数据本地化 requirements.
How to use
- Click "选择 PDF 文件" and pick a PDF (≤50 MB) from your device.
- Hit "📊 开始转换"; the status bar shows "正在转换第 X / Y 页..." while each page is parsed.
- For every page, pdf.js extracts the text stream; SheetJS rebuilds it into a2-D row × column grid.
- Once done, the converted.xlsx file downloads automatically — one sheet per page, named
Page1,Page2, …
常见用例 / Common use cases
- 财务报表搬运:把季报、年报里的财务数据表导出到 Excel,便于用公式二次汇总、做图表。
- 发票 /订单批量录入:供应商发来的 PDF订单清单直接转成 xlsx,导入 ERP 或对账系统。
- 成绩单 / 名册整理:学校或机构下发的 PDF名单一键转表格,方便筛选排序。
- 科研数据提取:论文 PDF里的实验数据表提取到 Excel进一步统计分析。
FAQ —常见问题
Q:扫描件 PDF 或图片表格能识别吗?
A:本工具只能解析可选中的纯文本表格。如果 PDF 是扫描件、或表格本身就是一张嵌入图片(在 Adobe Reader 里无法用鼠标选中文字),则需要先用 OCR工具(如含文字层的再导出 PDF)预处理。我们暂未内置 OCR,以保证完全本地、零上传。
Q:Will merged / split cells, colors, formulas be preserved?
A:No. This is a text-only extraction — it captures row × column positions and cell strings only. Cell merging, background color, borders, formulas, images embedded inside the table and other visual formatting are intentionally dropped. The output is a clean data grid ready for pivot tables and formulas.
Q:为什么我的表格被分成两列?如何改进?
A:PDF 的文字流按 x坐标分列;若原 PDF排版时相邻单元格间距过宽,可能被算法当成不同列。解决方法是先用 PDF提取文本工具看下原始文字流,如果确认是单列内容,把宽间距调小后重新生成 PDF 再转换。
Q:Is there any file size or page count limit?
A:Single PDF ≤ 50 MB. There is no hard page limit, but conversion speed depends on your device — large PDFs with hundreds of pages may take a minute.
小贴士 / Tips & Related Tools
- 转换前可先用 PDF提取文本工具预览文字流,确认表格是否可选中文字,再决定是否走本工具。
- 转换后用 Excel 的"数据 → 分列"或透视表进一步清洗,可以弥补纯文本推断的局限。
- 本工具仅处理纯文本表格;扫描件请先用含 OCR 的桌面软件转可搜索 PDF 后再来转换。
- 如果 PDF 页数过多(>200页),建议先用 PDF拆分分批处理,避免单次内存峰值过高。
- 转出来的 .xlsx 想加公司抬头或页眉水印?配合 PDF加水印使用更顺手。
相关工具 / Related PDF tools (10):PDF合并 · PDF拆分 · PDF提取文本 · PDF提取图片 · PDF压缩 · PDF加密 · PDF 加水印 · PDF旋转 · PDF 转 Word · 截图转 PDF