
使用python把pdf转成execl
项目已经打包好,想要直接使用的可以下载exe包。使用python把pdf转成execl。
·
使用python把pdf转成execl
from PyPDF2 import PdfReader
from openpyxl import Workbook
def pdf_to_excel(pdf_file):
# 打开PDF文件
pdf = PdfReader(open(pdf_file, 'rb'))
# 生成Excel文件名,将PDF后缀替换为xlsx后缀
excel_file = pdf_file.replace('.pdf', '.xlsx')
# 创建一个Excel工作簿
wb = Workbook()
ws = wb.active
# 逐页读取PDF并将其写入Excel
for page_num in range(len(pdf.pages)):
page = pdf.pages[page_num]
text = page.extract_text()
lines = text.split('\n')
# 将PDF文本的每一行写入Excel的一行
for line_num, line in enumerate(lines, start=1):
ws.cell(row=line_num, column=1, value=line)
# 保存Excel文件
wb.save(excel_file)
print(f'已生成Excel文件:{excel_file}')
if __name__ == "__main__":
pdf_file = input("请输入PDF文件名:") # 从用户输入获取PDF文件名
pdf_to_excel(pdf_file)
项目已经打包好,想要直接使用的可以下载exe包
更多推荐
所有评论(0)