玩转 Excel|Pandas、pywin32
信息
2024年9月6日 · ·
引言
Excel
是在数据处理和分析中一种最常用的工具,而 Python 是一种强大的编程语言。结合 Python 的数据处理库,可以方便地操作 Excel 文件,进行数据读取、处理、分析和报告生成等工作。本文将介绍如何使用 Python 操作 Excel 文件,包括读取、写入、数据处理、样式设置、数据验证、公式支持和图表创建等方面的内容。
在 Python 中,有多种库和方法可以操作 Excel 文件。下面我们捡一些常用的库及其基本操作进行介绍。
Pandas
Pandas
是一个强大的数据分析和处理库,非常适合处理表格数据。它可以读取 Excel 文件:pd.read_excel()
;写入 Excel 文件:DataFrame.to_excel()
;处理 DataFrame,对数据进行筛选、聚合等操作。
安装 Pandas
pip install pandas
导入 Pandas
import pandas as pd
读取 Excel
Pandas 可以读取 .xls
和 .xlsx
文件。可以指定读取特定的 sheet。
import pandas as pd
# 读取整个 Excel 文件
df = pd.read_excel('file.xlsx')
# 读取特定的 sheet
df_sheet1 = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 读取多个 sheet
dfs = pd.read_excel('file.xlsx', sheet_name=['Sheet1', 'Sheet2'])
写入 Excel
Pandas 可以将 DataFrame 保存为 Excel 文件。可以选择是否写入索引。
# 创建一个简单的 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [24, 30, 22]
}
df = pd.DataFrame(data)
# 写入 Excel 文件
df.to_excel('output.xlsx', index=False) # 不写入索引