使用python把pdf转成execl

from PyPDF2 import PdfReader
from openpyxl import Workbook

def pdf_to_excel(pdf_file):
    # 打开PDF文件
    pdf = PdfReader(open(pdf_file, 'rb'))

    # 生成Excel文件名,将PDF后缀替换为xlsx后缀
    excel_file = pdf_file.replace('.pdf', '.xlsx')

  # 创建一个Excel工作簿
    wb = Workbook()
    ws = wb.active

    # 逐页读取PDF并将其写入Excel
    for page_num in range(len(pdf.pages)):
        page = pdf.pages[page_num]
        text = page.extract_text()
        lines = text.split('\n')

        # 将PDF文本的每一行写入Excel的一行
        for line_num, line in enumerate(lines, start=1):
            ws.cell(row=line_num, column=1, value=line)

    # 保存Excel文件
    wb.save(excel_file)
    print(f'已生成Excel文件:{excel_file}')

if __name__ == "__main__":
    pdf_file = input("请输入PDF文件名:")  # 从用户输入获取PDF文件名
    pdf_to_excel(pdf_file)

项目已经打包好,想要直接使用的可以下载exe包

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐