当前位置：网站首页 > 技术文章 > 正文

pandas 循环读取文件夹下的 excel，并汇总到一张表格

itomcoil 2025-01-04 20:22 33 浏览

-- coding:utf-8 –-

"""

利用 pandas 将多张 excel 表中的指定列数据合并成一张；因为原始的多张数据存在同样列名的数据，

因为原始多张 excel 是从 csv 文件转换股

并且我们只需要其中的部分列数据，所以进行指定列提取并汇总至 res 文件中

"""

import os

import pandas as pd

输入参数为 excel 表格所在目录

def to_one_excel(dir):

dfs = []

# 遍历文件目录，将所有表格表示为 pandas 中的 DataFrame 对象

# for root_dir, sub_dir, files in os.walk(r'' + dir): # 第一个为起始路径，第二个为起始路径下的文件夹，第三个是起始路径下的文件。

for root_dir, sub_dir, files in os.walk(dir): # 第一个为起始路径，第二个为起始路径下的文件夹，第三个是起始路径下的文件。

for file in files:

if file.endswith(‘xlsx’):

# 构造绝对路径

file_name = os.path.join(root_dir, file)

# df = pd.read_excel(file_name)

df_1 = list(pd.read_excel(file_name, nrows=1)) # 读取 excel 第一行数据并放进列表

# excel 第一行数据返回列表

print(file_name)

print(type(df_1))

print(df_1)

# 根据第一行列名获取每个文件中需要列的列索引，返回索引数值

suo_yin_1 = df_1.index(“Billing Country”)

suo_yin_2 = df_1.index(“Created at”)

suo_yin_3 = df_1.index(“Updated at”)

suo_yin_4 = df_1.index(“Paid Price”)

suo_yin_5 = df_1.index(“Shipment Type Name”)

suo_yin_6 = df_1.index(“Status”)

# 读取文件内容 usecols=[1, 3, 4] 读取第 1,3,4 列

df = pd.read_excel(file_name, usecols=[suo_yin_1, suo_yin_2, suo_yin_3, suo_yin_4, suo_yin_5, suo_yin_6]

, sheet_name=‘data’)

# pf = pd.read_excel('xxx.xls', usecols=[1, 3, 4], sheet_name='data')

# print(pf)

# 追加一列数据，将每个文件的名字追加进该文件的数据中，确定每条数据属于哪个文件

excel_name = file.replace(".xlsx", "") # 提取每个excel文件的名称，去掉.xlsx后缀

df["店铺"] = excel_name # 新建列名为“店铺”，列数据为excel文件名

dfs.append(df) # 将新建店铺列追加进汇总excel中

# 行合并

df_concated = pd.concat(dfs)

# 构造输出目录的绝对路径

out_path = os.path.join(dir, 'res.xlsx')

# 输出到excel表格中，并删除pandas默认的index列

df_concated.to_excel(out_path, sheet_name='Sheet1', index=None)

调用并执行函数

to_one_excel(r’C:\Users\Administrator\Desktop\ceshi\xlsx 文件’)

pandas append

上一篇：别再用Pandas处理大数据了!现在你拥有更好的选择
下一篇：总结了这67个pandas函数，完美解决数据处理，拿来即用

pandas 循环读取文件夹下的 excel，并汇总到一张表格

相关推荐

我用 1 个 2 手计算器换了 3 台 MacBook(上)

零基础也能搞定!DeepSeek大模型本地安装全攻略

Win7中同时安装python2和python3的方法

按颜色计数、求和、算平均值或最大值?学这个函数就够啦!

SpringBoot中使用LocalDateTime踩坑记录

中药古今研究:人参

「mysql第二次安装不了」mysql安装失败怎么清理干净?

RSA 复杂题目 ?

深入理解Python中的try-except语句，避免代码崩溃的噩梦

python解释器管理工具pyenv使用说明