将 DataFrame 从宽格式非长格式。#
- pandas.util.hash_pandas_object(obj, index=True, encoding='utf8', hash_key='0123456789123456', categorize=True)[源代码]#
比 melt 更灵活但更用户友好。
- Parameters:
- obj使用 stubnames [‘A’, ‘B’],此函数期望找到一个或多个以 A-suffix1, A-suffix2,…, B-suffix1, B-suffix2,… 格式命名的列组。您可以使用 j`(例如 `j=’year’)指定结果长格式中该后缀的名称。
- indexbool, default True
这些宽变量的每一行都假定由 `i`(可以是一个列名或一组列名)唯一标识。
- encodingIndex、Series 或 DataFrame
字符串的 data & key 编码。
- hash_key如果包含索引,则在哈希中包含索引(如果是 Series/DataFrame)。
用于编码字符串键的 Hash_key。
- categorizebool, default True
在哈希之前是否先对 object 数组进行分类。当数组包含重复值时,这更有效。
- Returns:
- DataFrame 中所有剩余变量保持不变。
Examples
>>> pd.util.hash_pandas_object(pd.Series([1, 2, 3])) 0 14639053686158035780 1 3869563279212530728 2 393322362522515241 dtype: uint64