pandas.DataFrame.melt#
- DataFrame.melt(id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True)[源代码]#
将 DataFrame 从宽格式重塑为长格式,并可选择保留标识符。
此函数有助于将 DataFrame 整理成一种格式,其中一个或多个列是标识符变量(id_vars),而所有其他列(视为测量变量 value_vars)被“取消透视”到行轴,只留下两个非标识符列“variable”和“value”。
- Parameters:
- id_vars标量、元组、列表或 ndarray,可选
用作标识符变量的列。
- value_vars标量、元组、列表或 ndarray,可选
要取消透视的列。如果未指定,则使用所有未设置为 id_vars 的列。
- var_name标量,默认为 None
用作“variable”列的名称。如果为 None,则使用
frame.columns.name或“variable”。- value_name标量,默认为 ‘value’
用作“value”列的名称,不能是现有列标签。
- col_levelscalar, optional
如果列是 MultiIndex,则使用此级别进行 melt。
- ignore_indexbool, default True
如果为 True,则忽略原始索引。如果为 False,则保留原始索引。索引标签将根据需要重复。
- Returns:
- DataFrame
取消透视的 DataFrame。
参见
melt相同的方法。
pivot_table创建电子表格风格的透视表作为 DataFrame。
DataFrame.pivot返回由给定的索引/列值组织的重塑后的 DataFrame。
DataFrame.explode将数据帧从列表状列展开为长格式。
Notes
有关更多示例,请参阅 the user guide 。
Examples
>>> df = pd.DataFrame({'A': {0: 'a', 1: 'b', 2: 'c'}, ... 'B': {0: 1, 1: 3, 2: 5}, ... 'C': {0: 2, 1: 4, 2: 6}}) >>> df A B C 0 a 1 2 1 b 3 4 2 c 5 6
>>> df.melt(id_vars=['A'], value_vars=['B']) A variable value 0 a B 1 1 b B 3 2 c B 5
>>> df.melt(id_vars=['A'], value_vars=['B', 'C']) A variable value 0 a B 1 1 b B 3 2 c B 5 3 a C 2 4 b C 4 5 c C 6
“variable”和“value”列的名称是可自定义的:
>>> df.melt(id_vars=['A'], value_vars=['B'], ... var_name='myVarname', value_name='myValname') A myVarname myValname 0 a B 1 1 b B 3 2 c B 5
原始索引值可以保留:
>>> df.melt(id_vars=['A'], value_vars=['B', 'C'], ignore_index=False) A variable value 0 a B 1 1 b B 3 2 c B 5 0 a C 2 1 b C 4 2 c C 6
如果您有多层索引列:
>>> df.columns = [list('ABC'), list('DEF')] >>> df A B C D E F 0 a 1 2 1 b 3 4 2 c 5 6
>>> df.melt(col_level=0, id_vars=['A'], value_vars=['B']) A variable value 0 a B 1 1 b B 3 2 c B 5
>>> df.melt(id_vars=[('A', 'D')], value_vars=[('B', 'E')]) (A, D) variable_0 variable_1 value 0 a B E 1 1 b B E 3 2 c B E 5