用户指南#
用户指南涵盖了 pandas 的所有主题领域。每个子部分都介绍一个主题(例如“处理缺失数据”),并讨论 pandas 如何处理该问题,其中包含许多示例。
Users brand-new to pandas should start with 10 分钟上手 pandas.
For a high level summary of the pandas fundamentals, see 数据结构简介 and 基本功能.
Further information on any specific method can be obtained in the API 参考.
如何阅读这些指南#
在这些指南中,您将在代码块中看到输入代码,例如:
import pandas as pd
pd.DataFrame({'A': [1, 2, 3]})
或者:
第一个块是标准的 Python 输入,而在第二个块中,In [1]: 表示输入位于 notebook 中。在 Jupyter Notebook 中,最后一行会被打印出来,并且图表会内联显示。
例如:
等价于:
a = 1
print(a)
指南#
- 10 分钟上手 pandas
- 数据结构简介
- 基本功能
- IO 工具(文本、CSV、HDF5 等)
- pandas 可以利用 PyArrow 来扩展功能并提高各种 API 的性能。这包括:
- 索引和选择数据
- MultiIndex / 高级索引
- 写时复制(Copy-on-Write, CoW)
- 合并、连接、连接和比较
- 重塑和透视表
- 处理文本数据
- 处理缺失数据
- 重复标签
- 类别数据
- 可空整数数据类型
- 可为空的布尔数据类型
- 图表可视化
- 表格可视化
- 按组分组:拆分-应用-合并
- 窗口操作
- 时间序列/日期功能
- 时间差
- 选项和设置
- 提升性能
- 扩展到大型数据集
- 稀疏数据结构
- 新字符串数据类型(pandas 3.0)迁移指南
- 常见问题解答 (FAQ)
- 食谱