pandas.arrays.StringArray#
- class pandas.arrays.StringArray(values, copy=False)[源代码]#
字符串数据的扩展数组。
警告
StringArray 目前处于实验阶段。实现和 API 的部分内容可能会在没有任何警告的情况下发生更改。
- Parameters:
- values类数组
数据数组。
警告
目前,这需要一个对象 dtype 的 ndarray,其元素是 Python 字符串或 nan-like 值(
None、np.nan、NA)。未来这可能会在没有任何警告的情况下发生更改。使用dtype="string"的pandas.array()是从任何序列创建 StringArray 的稳定方法。在 1.5.0 版本发生变更: StringArray 现在除了字符串和
pandas.NA之外,还接受包含 nan-like 值(None、np.nan)的 array-like 作为values参数。- copybool,默认 False
是否复制数据数组。
参见
pandas.array()创建 StringArray 的推荐函数。
Series.str以 StringArray 为后备的 Series 上可以使用字符串方法。
Notes
StringArray 对比较方法返回 BooleanArray。
Examples
>>> pd.array(['This is', 'some text', None, 'data.'], dtype="string") <StringArray> ['This is', 'some text', <NA>, 'data.'] Length: 4, dtype: string
与使用
dtype="object"实例化的数组不同,StringArray会将值转换为字符串。>>> pd.array(['1', 1], dtype="object") <NumpyExtensionArray> ['1', 1] Length: 2, dtype: object >>> pd.array(['1', 1], dtype="string") <StringArray> ['1', '1'] Length: 2, dtype: string
但是,直接使用非字符串值实例化 StringArray 会引发错误。
对于比较方法,StringArray 返回一个
pandas.BooleanArray:>>> pd.array(["a", None, "c"], dtype="string") == "a" <BooleanArray> [True, <NA>, False] Length: 3, dtype: boolean
Attributes
None
Methods
None