pandas.arrays.StringArray#

class pandas.arrays.StringArray(values, copy=False)[源代码]#

字符串数据的扩展数组。

警告

StringArray 目前处于实验阶段。实现和 API 的部分内容可能会在没有任何警告的情况下发生更改。

Parameters:
values类数组

数据数组。

警告

目前,这需要一个对象 dtype 的 ndarray,其元素是 Python 字符串或 nan-like 值(Nonenp.nanNA)。未来这可能会在没有任何警告的情况下发生更改。使用 dtype="string"pandas.array() 是从任何序列创建 StringArray 的稳定方法。

在 1.5.0 版本发生变更: StringArray 现在除了字符串和 pandas.NA 之外,还接受包含 nan-like 值(Nonenp.nan)的 array-like 作为 values 参数。

copybool,默认 False

是否复制数据数组。

参见

pandas.array()

创建 StringArray 的推荐函数。

Series.str

以 StringArray 为后备的 Series 上可以使用字符串方法。

Notes

StringArray 对比较方法返回 BooleanArray。

Examples

>>> pd.array(['This is', 'some text', None, 'data.'], dtype="string")
<StringArray>
['This is', 'some text', <NA>, 'data.']
Length: 4, dtype: string

与使用 dtype="object" 实例化的数组不同,StringArray 会将值转换为字符串。

>>> pd.array(['1', 1], dtype="object")
<NumpyExtensionArray>
['1', 1]
Length: 2, dtype: object
>>> pd.array(['1', 1], dtype="string")
<StringArray>
['1', '1']
Length: 2, dtype: string

但是,直接使用非字符串值实例化 StringArray 会引发错误。

对于比较方法,StringArray 返回一个 pandas.BooleanArray

>>> pd.array(["a", None, "c"], dtype="string") == "a"
<BooleanArray>
[True, <NA>, False]
Length: 3, dtype: boolean

Attributes

None

Methods

None