用DeepSeek+Trae 自己写PDF表格转为EXCEL表格

itomcoil 2025-04-30 17:34 17 浏览

如何将下面PDF表格转为EXCEL能更好统计

在TRAE 提问：

新建窗口-选择文件夹-

写一个PDF转excel 电脑程序：样式不变，界面有选择文件，有输出文件，显示进度及页码，开始，暂停，退出，实现所有功能写出全部代码

DEEPSEEK 进行深度思考：

好的，我将帮助您创建一个PDF转Excel的桌面程序。首先需要设计GUI界面包含文件选择、输出路径、进度显示等功能。核心部分需要使用Python的PyMuPDF或pdfplumber库解析PDF内容，用openpyxl生成Excel文件。建议采用Tkinter实现界面，通过多线程处理转换任务防止界面卡顿，并添加暂停/恢复逻辑。将创建包含GUI布局、PDF解析逻辑和Excel格式处理三个核心模块。

代码：import tkinter as tk
from tkinter import ttk, filedialog
import threading
import fitz # PyMuPDF
import openpyxl
from queue import Queue

class PDFConverterApp:
def __init__(self, master):
self.master = master
master.title("PDF转Excel工具")
# 文件选择部分
self.input_frame = ttk.Frame(master)
self.input_frame.pack(pady=10, fill='x')
self.input_btn = ttk.Button(self.input_frame, text="选择PDF文件", command=self.select_pdf)
self.input_btn.pack(side='left')
self.input_label = ttk.Label(self.input_frame, text="未选择文件")
self.input_label.pack(side='left', padx=10)
# 输出路径部分
self.output_frame = ttk.Frame(master)
self.output_frame.pack(pady=10, fill='x')
self.output_btn = ttk.Button(self.output_frame, text="选择输出路径", command=self.select_output)
self.output_btn.pack(side='left')
self.output_label = ttk.Label(self.output_frame, text="未选择路径")
self.output_label.pack(side='left', padx=10)
# 进度条
self.progress = ttk.Progressbar(master, orient='horizontal', length=200, mode='determinate')
self.progress.pack(pady=10)
# 控制按钮
self.btn_frame = ttk.Frame(master)
self.btn_frame.pack(pady=10)
self.start_btn = ttk.Button(self.btn_frame, text="开始转换", command=self.start_conversion)
self.start_btn.pack(side='left', padx=5)
self.pause_btn = ttk.Button(self.btn_frame, text="暂停", state='disabled', command=self.toggle_pause)
self.pause_btn.pack(side='left', padx=5)
self.exit_btn = ttk.Button(self.btn_frame, text="退出", command=master.quit)
self.exit_btn.pack(side='left', padx=5)
# 状态变量
self.is_paused = False
self.current_page = 0
self.conversion_thread = None
self.queue = Queue()
def select_pdf(self):
file_path =
filedialog.askopenfilename(filetypes=[("PDF文件", "*.pdf")])
if file_path:
self.input_label.config(text=file_path)
def select_output(self):
output_path = filedialog.askdirectory()
if output_path:
self.output_label.config(text=output_path)
def start_conversion(self):
# 验证输入输出路径
# 启动转换线程
self.conversion_thread = threading.Thread(target=self.convert_pdf)
self.conversion_thread.start()
self.start_btn.config(state='disabled')
self.pause_btn.config(state='normal')
def toggle_pause(self):
self.is_paused = not self.is_paused
self.pause_btn.config(text="继续" if self.is_paused else "暂停")
def convert_pdf(self):
try:
pdf_path = self.input_label.cget("text")
output_dir = self.output_label.cget("text")
if not pdf_path or not output_dir:
self.queue.put(('error', '请先选择PDF文件和输出路径'))
return

doc = fitz.open(pdf_path)
total_pages = len(doc)
wb = openpyxl.Workbook()
ws = wb.active
for page_num in range(total_pages):
while self.is_paused:
pass # 暂停状态循环等待
page = doc.load_page(page_num)
text = page.get_text()
# 按行写入Excel
for row_num, line in enumerate(text.split('\n'), 1):
ws.cell(row=row_num, column=1, value=line)
# 更新进度
self.current_page = page_num + 1
progress = (self.current_page / total_pages) * 100
self.queue.put(('progress', (progress, f'正在转换第{self.current_page}页')))
output_path = f"{output_dir}/output.xlsx"
wb.save(output_path)
self.queue.put(('complete', f'转换完成！文件已保存至：{output_path}'))
except Exception as e:
self.queue.put(('error', f'转换失败：{str(e)}'))
finally:
self.start_btn.config(state='normal')
self.pause_btn.config(state='disabled')

if __name__ == "__main__":
root = tk.Tk()
app = PDFConverterApp(root)
root.mainloop()

提示需要的安装库：pip install PyMuPDF openpyxl 在命令行执行

执行PYTHON+文件名命令运行

测试是否达到完成要求？

追加功能显示转化代码

如果有语法错误，自动修改错误

总结一下：在写软件要求时，第一步提问尽量要全面，要修改的话，容易逻辑上出错

可以让DEEPSEEK写出软件设计方案

openpyxl安装

上一篇：使用Python(Pandas库)合并多个excel
下一篇：怎么在Python中操作Excel文件?（python如何操作excel）

用DeepSeek+Trae 自己写PDF表格转为EXCEL表格

如何将下面PDF表格转为EXCEL能更好统计

DEEPSEEK 进行深度思考：

执行PYTHON+文件名命令运行

测试是否达到完成要求？

追加功能显示转化代码

相关推荐

我用 1 个 2 手计算器换了 3 台 MacBook(上)

零基础也能搞定!DeepSeek大模型本地安装全攻略

Win7中同时安装python2和python3的方法

Python三目运算符(三元运算符)用法详解

PS零基础入门教程:Photoshop 2024工具详解—标尺工具

按颜色计数、求和、算平均值或最大值?学这个函数就够啦!

SpringBoot中使用LocalDateTime踩坑记录

中药古今研究:人参

「mysql第二次安装不了」mysql安装失败怎么清理干净?

最全的linux安装软件方法 linux安装软件流程

用DeepSeek+Trae 自己写PDF表格转为EXCEL表格

如何将下面PDF表格转为EXCEL能更好统计

DEEPSEEK 进行深度思考：

执行PYTHON+文件名 命令运行

测试是否达到完成要求？

追加功能显示转化代码

相关推荐

我用 1 个 2 手计算器换了 3 台 MacBook(上)

零基础也能搞定!DeepSeek大模型本地安装全攻略

Win7中同时安装python2和python3的方法

Python三目运算符(三元运算符)用法详解

PS零基础入门教程:Photoshop 2024工具详解—标尺工具

按颜色计数、求和、算平均值或最大值?学这个函数就够啦!

SpringBoot中使用LocalDateTime踩坑记录

中药古今研究:人参

「mysql第二次安装不了」mysql安装失败怎么清理干净?

最全的linux安装软件方法 linux安装软件流程

执行PYTHON+文件名命令运行