DataFrame#
构造函数#
|
二维的、可变大小的、可能异构的表格数据。 |
属性和底层数据#
轴
DataFrame 的索引(行标签)。 |
|
DataFrame 的列标签。 |
返回 DataFrame 中的 dtypes。 |
|
|
打印DataFrame的简洁摘要。 |
|
根据列的数据类型返回 DataFrame 列的子集。 |
返回 DataFrame 的 Numpy 表示。 |
|
返回表示 DataFrame 轴的列表。 |
|
返回一个整数,表示轴/数组的维度数。 |
|
返回一个整数,表示此对象中的元素数量。 |
|
返回一个元组,表示 DataFrame 的维度。 |
|
|
返回每列的内存使用量(以字节为单位)。 |
指示 Series/DataFrame 是否为空。 |
|
|
返回一个具有更新标志的新对象。 |
转换#
|
将 pandas 对象转换为指定的 dtype |
|
使用支持 |
|
尝试为对象列推断更好的数据类型(dtypes)。 |
|
复制此对象的索引和数据。 |
(已弃用) 返回单个元素的 Series 或 DataFrame 的布尔值。 |
|
|
将 DataFrame 转换为 NumPy 数组。 |
索引,迭代#
|
返回前`n`行。 |
按行/列标签对访问单个值。 |
|
按整数位置的行/列对访问单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
(已弃用) 纯粹基于整数位置的索引,用于按位置选择。 |
|
|
在指定位置将列插入DataFrame。 |
遍历info轴。 |
|
迭代(列名,Series)对。 |
|
获取“info axis”(参见索引章节更多内容)。 |
|
迭代DataFrame行作为(索引,Series)对。 |
|
|
将DataFrame行迭代为命名元组。 |
|
返回指定项并从 DataFrame 中删除。 |
|
返回最后 n 行。 |
|
从Series/DataFrame中返回横截面。 |
|
获取给定键的对象项(例如:DataFrame列)。 |
|
DataFrame中的每个元素是否包含在values中。 |
|
替换条件为False的值。 |
|
在条件为 True 的位置替换值。 |
|
使用布尔表达式查询 DataFrame 列。 |
有关 .at, .iat, .loc 和 .iloc 的详细信息,请参阅 indexing documentation 。
二元运算符函数#
|
获取DataFrame与另一个对象的逐列加法。 |
|
获取 DataFrame 和 other 的逐元素加法(二元运算符 add)。 |
|
DataFrame 与其他项的减法,逐元素(二元运算符 sub)。 |
|
获取 DataFrame 和 other 的乘积,逐个元素计算(二进制运算符 mul)。 |
|
对 DataFrame 和 other 进行浮点除法,逐元素进行(二元运算符 truediv)。 |
|
对 DataFrame 和 other 进行浮点除法,逐元素进行(二元运算符 truediv)。 |
|
对DataFrame和其他值进行整除,逐元素进行(二元运算符 floordiv)。 |
|
获取 DataFrame 和 other 的模(remainder),逐个元素计算(二进制运算符 mod)。 |
|
获取 DataFrame 和 other 的指数幂,逐个元素计算(二进制运算符 pow)。 |
|
计算 DataFrame 和 other 之间的矩阵乘积。 |
|
获取 DataFrame 和其他元素的加法,逐元素进行(二元运算符 radd)。 |
|
获取 DataFrame 和其他元素的减法,逐元素进行(二元运算符 rsub)。 |
|
获取 DataFrame 和其他元素的乘法,逐元素进行(二元运算符 rmul)。 |
|
获取 DataFrame 和其他元素的浮点数除法,逐元素进行(二元运算符 rtruediv)。 |
|
获取 DataFrame 和其他元素的浮点数除法,逐元素进行(二元运算符 rtruediv)。 |
|
获取 DataFrame 和其他元素的整数除法,逐元素进行(二元运算符 rfloordiv)。 |
|
获取 DataFrame 和其他元素的模运算,逐元素进行(二元运算符 rmod)。 |
|
获取 DataFrame 和其他元素的指数幂,逐元素进行(二元运算符 rpow)。 |
|
获取 DataFrame 和 other 小于的元素(二进制运算符 lt)。 |
|
对DataFrame和其他值进行大于比较,逐元素进行(二元运算符 gt)。 |
|
获取 DataFrame 和 other 小于或等于的元素(二进制运算符 le)。 |
|
对DataFrame和其他值进行大于或等于比较,逐元素进行(二元运算符 ge)。 |
|
获取 DataFrame 和 other 不等于的元素(二进制运算符 ne)。 |
|
获取 DataFrame 和 other 的相等值,逐元素进行(二元运算符 eq)。 |
|
将另一 DataFrame 进行逐列合并。 |
|
使用 other 中相同位置的值更新 null 元素。 |
函数应用、GroupBy 和窗口#
|
沿 DataFrame 的轴应用函数。 |
|
将函数逐个元素应用到 DataFrame。 |
|
(已弃用) 逐元素应用函数到 DataFrame。 |
|
应用可链式调用的函数,这些函数期望 Series 或 DataFrame。 |
|
沿指定轴使用一个或多个操作进行聚合。 |
|
沿指定轴使用一个或多个操作进行聚合。 |
|
在self上调用``func``,生成一个与self具有相同轴形状的DataFrame。 |
|
使用映射器或列Series对DataFrame进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权 (EW) 计算。 |
计算 / 描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回所有元素是否为 True,可能沿轴进行。 |
|
返回是否有任何元素是 True,可能沿轴进行。 |
|
在输入阈值处截断值。 |
|
计算列的成对相关性,排除 NA/null 值。 |
|
计算成对相关性。 |
|
计算每列或每行的非 NA 单元格数。 |
|
计算列的成对协方差,排除 NA/null 值。 |
|
返回 DataFrame 或 Series 轴上的累积最大值。 |
|
返回 DataFrame 或 Series 轴上的累积最小值。 |
|
返回 DataFrame 或 Series 轴上的累积乘积。 |
|
返回 DataFrame 或 Series 轴上的累积和。 |
|
生成描述性统计信息。 |
|
元素的离散差分。 |
|
计算描述 DataFrame 列操作的字符串。 |
|
返回所请求轴上的无偏峰度。 |
|
返回所请求轴上的无偏峰度。 |
|
返回请求轴上值的最大值。 |
|
返回请求轴上值的平均值。 |
|
返回请求轴上值的中位数。 |
|
返回请求轴上值的最小值。 |
|
获取所选轴上每个元素的众数。 |
|
当前元素与先前元素之间的分数变化。 |
|
返回请求轴上值的乘积。 |
|
返回请求轴上值的乘积。 |
|
在指定轴上指定分位数的返回值。 |
|
沿指定轴计算数值数据的排名(1 到 n)。 |
|
将 DataFrame 四舍五入到可变小数位数。 |
|
在指定轴上返回无偏标准误差。 |
|
在指定轴上返回无偏偏度。 |
|
返回所请求轴上的值的总和。 |
|
返回所请求轴上的样本标准差。 |
|
返回所请求轴上无偏方差。 |
|
计算指定轴上不同元素的数量。 |
|
返回一个Series,其中包含DataFrame中每个不同行的频率。 |
重索引 / 选择 / 标签操作#
|
在标签前添加字符串 prefix。 |
|
在标签后添加字符串 suffix。 |
|
使用指定的连接方法按轴对齐两个对象。 |
|
选择一天中特定时间的(例如,上午 9:30)值。 |
|
选择一天中特定时间段内的(例如,上午 9:00-9:30)值。 |
|
删除行或列中指定的标签。 |
|
返回删除重复行后的 DataFrame。 |
|
返回表示重复行的布尔 Series。 |
|
测试两个对象是否包含相同元素。 |
|
根据指定的索引标签对DataFrame的行或列进行子集选择。 |
|
(已弃用) 根据日期偏移量选择时间序列数据的初始时段。 |
|
返回前`n`行。 |
|
返回请求轴上最大值的第一个出现索引。 |
|
返回请求轴上最小值第一个出现的索引。 |
|
(已弃用) 根据日期偏移量选择时间序列数据的最后时段。 |
|
根据可选的填充逻辑调整 DataFrame 的索引。 |
|
返回具有与 other 对象匹配的索引的对象。 |
|
重命名列或索引标签。 |
|
设置索引或列的轴名称。 |
|
重置索引或其某个级别。 |
|
从对象的轴中返回随机样本。 |
|
为指定轴分配所需的索引。 |
|
使用现有列设置 DataFrame 索引。 |
|
返回最后 n 行。 |
|
沿轴返回给定 位置 索引中的元素。 |
|
截断Series或DataFrame在某个索引值之前和之后的部分。 |
缺失数据处理#
|
(已弃用) 使用下一个有效观测值填充 NaN/NA 值以填补间隙。 |
|
使用下一个有效观测值填充 NaN/NA 值以填补间隙。 |
|
删除缺失值。 |
|
使用最后一个有效观测值传播NA/NaN值。 |
|
使用指定的方法填充NA/NaN值。 |
|
使用插值方法填充NaN值。 |
检测缺失值。 |
|
DataFrame.isnull 是 DataFrame.isna 的别名。 |
|
检测存在的(非缺失)值。 |
|
DataFrame.notnull 是 DataFrame.notna 的别名。 |
|
|
(已弃用)通过传播最后一个有效观测值来填充 NA/NaN 值。 |
|
用 value 替换 to_replace 中给定的值。 |
重塑、排序、转置#
|
返回删除所请求的索引/列级别的 Series/DataFrame。 |
|
返回由给定的索引/列值组织的重塑后的 DataFrame。 |
|
创建电子表格风格的透视表作为 DataFrame。 |
|
使用输入的顺序重新排列索引级别。 |
|
沿任一轴按值进行排序。 |
|
按标签(沿轴)对对象进行排序。 |
|
返回按 columns 降序排序的前 n 行。 |
|
返回按 columns 升序排序的前 n 行。 |
|
交换 |
|
将指定级别的列堆叠到索引。 |
|
对(必然是分层的)索引标签的某个级别进行“逆透视”。 |
|
(已弃用)交换轴并相应地交换值轴。 |
|
将 DataFrame 从宽格式重塑为长格式,并可选择保留标识符。 |
|
将类列表的每个元素转换为一行,并复制索引值。 |
|
将一维轴对象压缩成标量。 |
从pandas对象返回一个xarray对象。 |
|
DataFrame 的转置。 |
|
|
转置索引和列。 |
组合 / 比较 / 连接 / 合并#
|
为 DataFrame 分配新列。 |
|
比较另一个 DataFrame 并显示差异。 |
|
连接另一个DataFrame的列。 |
|
将 DataFrame 或命名 Series 对象与数据库风格的连接(join)进行合并。 |
|
使用另一个DataFrame中的非NA值原地修改。 |
标志 (Flags)#
标志 (Flags) 指的是 pandas 对象的属性。数据集的属性(例如记录日期、访问的 URL 等)应存储在 DataFrame.attrs 中。
|
应用于 pandas 对象的 Flags。 |
元数据 (Metadata)#
DataFrame.attrs 是一个用于为此 DataFrame 存储全局元数据的字典。
警告
DataFrame.attrs 被认为是实验性的,可能会在没有警告的情况下进行更改。
此数据集的全局属性字典。 |
绘图 (Plotting)#
DataFrame.plot 既是一个可调用的方法,也是一个命名空间属性,用于形式为 DataFrame.plot.<kind> 的特定绘图方法。
|
DataFrame 绘图访问器和方法 |
|
绘制堆叠面积图。 |
|
垂直条形图。 |
|
绘制横向条形图。 |
|
绘制 DataFrame 列的箱线图。 |
|
使用高斯核函数生成核密度估计图。 |
|
生成六边形分箱图。 |
|
绘制 DataFrame 列的直方图。 |
|
使用高斯核函数生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制成线图。 |
|
生成饼图。 |
|
创建具有不同标记点大小和颜色的散点图。 |
|
从 DataFrame 列制作箱线图。 |
|
绘制DataFrame列的直方图。 |
稀疏访问器 (Sparse accessor)#
稀疏数据类型 (sparse-dtype) 的特定方法和属性在 DataFrame.sparse 访问器下提供。
稀疏点与总(密集)数据点之比。 |
|
从 scipy 稀疏矩阵创建新的 DataFrame。 |
以稀疏 SciPy COO 矩阵的形式返回 DataFrame 的内容。 |
|
将具有稀疏值的 DataFrame 转换为密集格式。 |
序列化/IO/转换 (Serialization / IO / conversion)#
|
从数组类或字典的字典构建DataFrame。 |
|
将结构化或记录式ndarray转换为DataFrame。 |
|
将 DataFrame 写入 ORC 格式。 |
|
将 DataFrame 写入二进制 parquet 格式。 |
|
将对象 Pickle(序列化)到文件。 |
|
将对象写入逗号分隔值(csv)文件。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将存储在 DataFrame 中的记录写入 SQL 数据库。 |
|
将 DataFrame 转换为字典。 |
|
将对象写入 Excel 工作表。 |
|
将对象转换为 JSON 字符串。 |
|
将 DataFrame 渲染为 HTML 表。 |
|
将 DataFrame 写入二进制 Feather 格式。 |
|
将对象渲染为 LaTeX tabular、longtable 或嵌套表。 |
|
将 DataFrame 对象导出为 Stata dta 格式。 |
|
(已弃用)将 DataFrame 写入 Google BigQuery 表。 |
|
将 DataFrame 转换为 NumPy 记录数组。 |
|
将 DataFrame 渲染成控制台友好的表格输出。 |
|
将对象复制到系统剪贴板。 |
|
以 Markdown 友好的格式打印 DataFrame。 |
返回一个 Styler 对象。 |
|
|
返回实现互操作协议的dataframe互操作对象。 |