社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

关注

Py学习 » Python

跟小白学Python数据分析——批量提取PDF表格数据

小蚊子数据分析 • 4 年前 • 706 次点击

我们现在有一份PDF数据，里面有三页，每页都有一样数据结构但数据不同的数据表，现在需要使用Python将它批量提取出来。

长按识别下方二维码，并关注公众号

回复“PDF”获取案例数据

上回已经介绍了使用pdfplumber模块提取PDF表格数据，还没学习的请点击跟小白学Python数据分析——提取PDF表格数据今天我们继续使用它，只需要在上回的基础上使用for循环即可。

有了上回经验，我们就直接上代码：

 1import pdfplumber
 2import pandas as pd
 3
 4# 创建一个空数据框
 5df = pd.DataFrame()
 6
 7# 使用with语句打开pdf文件
 8with pdfplumber.open("D:\\python\\cai\\5.pdf") as pdf:
 9    # 使用for循环遍历每个pages
10    for page in pdf.pages:
11        # 取出当前页表格，结果为列表
12        d=page.extract_table()
13        # 将列表转为数据框
14        df1 = pd.DataFrame(d[1:], columns=d[0]) 
15        #添加至df数据框中
16        df = df.append(df1)

执行代码后，将得到了df数据框

是不是so easy 呢？

如果你喜欢本文，可以点击右下角在看
如果你在跟着学习，请在留言区留言：打卡
如果你刚看到本文，可以查看本系列历史文章跟着学习：
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
跟小白学Python数据分析——数据导入1
跟小白学Python数据分析——数据导入2

跟小白学Python数据分析——描述性统计分析

跟小白学Python数据分析——分组分析

跟小白学Python数据分析——列表

跟小白学Python数据分析——数据框

跟小白学Python数据分析——记录抽取

跟小白学Python数据分析——记录合并

跟小白学Python数据分析——数据导出

跟小白学Python数据分析——For循环

跟小白学Python数据分析——批量合并CSV文件

跟小白学Python数据分析——批量拆分Excel文件

跟小白学Python数据分析——提取PDF表格数据

-----------------

希望系统、快速学习Python数据分析知识，可以学习

数据分析专家@文彤老师的

《跟文彤老师学Python数据分析》系列视频课程

包含以下三门课程

Python数据分析--玩转Pandas

Python数据分析--玩转数据可视化

玩转Python统计分析

以上顺序也是学习的建议顺序

课程提供讲义（含代码）与数据供练习

学习过程有问题可加Q群与老师交流讨论

如还有其他问题也可添加课程助理微信号咨询，添加时请注明所咨询的课程

现参加课程学习，可享受6折优惠

购买课程直接点击文末“ 阅读原文”进入即可

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/62925

706 次点击

登录后回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号