社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

跟小白学Python数据分析——批量提取PDF表格数据

小蚊子数据分析 • 4 年前 • 706 次点击  

我们现在有一份PDF数据,里面有三页,每页都有一样数据结构但数据不同的数据表,现在需要使用Python将它批量提取出来


长按识别下方二维码,并关注公众号

回复“PDF”获取案例数据


上回已经介绍了使用pdfplumber模块提取PDF表格数据,还没学习的请点击 跟小白学Python数据分析——提取PDF表格数据 今天我们继续使用它,只需要在上回的基础上使用for循环即可。
有了上回经验,我们就直接上代码:
 1import pdfplumber
2import pandas as pd
3
4# 创建一个空数据框
5df = pd.DataFrame()
6
7# 使用with语句打开pdf文件
8with pdfplumber.open("D:\\python\\cai\\5.pdf"as pdf:
9    # 使用for循环遍历每个pages
10    for page in pdf.pages:
11        # 取出当前页表格,结果为列表
12        d=page.extract_table()
13        # 将列表转为数据框
14        df1 = pd.DataFrame(d[1:], columns=d[0]) 
15        #添加至df数据框中
16        df = df.append(df1)

执行代码后,将得到了df数据框


是不是so easy 呢?


如果你喜欢本文,可以点击右下角在看
如果你在跟着学习,请在留言区留言:打卡
如果你刚看到本文,可以查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
跟小白学Python数据分析——数据导入1
跟小白学Python数据分析——数据导入2

跟小白学Python数据分析——描述性统计分析

跟小白学Python数据分析——分组分析

跟小白学Python数据分析——列表

跟小白学Python数据分析——数据框

跟小白学Python数据分析——记录抽取

跟小白学Python数据分析——记录合并

跟小白学Python数据分析——数据导出

跟小白学Python数据分析——For循环

跟小白学Python数据分析——批量合并CSV文件

跟小白学Python数据分析——批量拆分Excel文件

跟小白学Python数据分析——提取PDF表格数据

-----------------

希望系统、快速学习Python数据分析知识,可以学习

数据分析专家@文彤老师

跟文彤老师学Python数据分析》系列视频课程

包含以下三门课程

Python数据分析--玩转Pandas

Python数据分析--玩转数据可视化

玩转Python统计分析


以上顺序也是学习的建议顺序

课程提供讲义(含代码)与数据供练习

学习过程有问题可加Q群与老师交流讨论

如还有其他问题也可添加课程助理微信号咨询,添加时请注明所咨询的课程

参加课程学习,可享受6折优惠

购买课程直接点击文末“ 阅读原文”进入即可

  

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/62925
 
706 次点击