import pandas as pd
import os
def batch_extract_data(columns, directory, output_filename):
all_data = pd.DataFrame()
# 遍历指定?件夹中的所有Excel?件
for file in os.listdir(directory):
if file.endswith('.xlsx'):
file_path = os.path.join(directory, file)
df = pd.read_excel(file_path, usecols=columns)
#添加?件来源信息,以便知道数据来?哪个分?
df['Source'] = os.path.splitext(file)[0]
# 将数据添加到总数据框架中
all_data = pd.concat([all_data, df], ignore_index=True)
# 将汇总的数据输出到新的 Excel ?件
all_data.to_excel(output_filename, index=False)
# 调?函数
batch_extract_data(["单号",'报价对象'],'C:\pycharm\project\题目\新建文件夹', 'Consolidated_Financials.xlsx')
在许多商业和研究场景中,批量提取特定的Excel数据是常?的需求。例如,?个企业可能需要从全国 各地分?机构提交的?度财务报告中提取特定的财务指标,如营业收?和利润,以便进?集中分析和 ?较。