pandas.read_sas#

pandas.read_sas(filepath_or_buffer, *, format=None, index=None, encoding=None, chunksize=None, iterator=False, compression='infer')[源代码]#

读取以 XPORT 或 SAS7BDAT 格式存储的 SAS 文件。

Parameters:
filepath_or_buffer字符串、路径对象或文件类对象

字符串、路径对象(实现 os.PathLike[str])或实现了二进制 read() 函数的文件类对象。字符串可以是 URL。有效的 URL 方案包括 http、ftp、s3 和 file。对于 file URL,需要主机名。本地文件可以是:file://localhost/path/to/table.sas7bdat

formatstr {‘xport’, ‘sas7bdat’} 或 None

如果为 None,则根据文件扩展名推断文件格式。如果为 ‘xport’ 或 ‘sas7bdat’,则使用相应的格式。

index索引列的标识符,默认为 None

DataFrame 的索引应使用的列的标识符。

encodingstr,默认为 None

文本数据的编码。如果为 None,则文本数据将作为原始字节存储。

chunksizeint

一次读取 chunksize 行,返回迭代器。

iteratorbool,默认为 False

如果为 True,则返回一个用于增量读取文件的迭代器。

compressionstr or dict, default ‘infer’

对磁盘上的数据进行即时解压缩。如果为 ‘infer’ 且 ‘filepath_or_buffer’ 是类路径,则根据以下扩展名检测压缩:’.gz’, ‘.bz2’, ‘.zip’, ‘.xz’, ‘.zst’, ‘.tar’, ‘.tar.gz’, ‘.tar.xz’ 或 ‘.tar.bz2’(否则不进行压缩)。如果使用 ‘zip’ 或 ‘tar’,ZIP 文件必须只包含一个要读取的数据文件。设置为 None 表示不解压缩。也可以是一个字典,其中键 'method' 设置为 {'zip', 'gzip', 'bz2', 'zstd', 'xz', 'tar'} 中的一个,其他键值对将转发到 zipfile.ZipFile, gzip.GzipFile, bz2.BZ2File, zstandard.ZstdDecompressor, lzma.LZMAFiletarfile.TarFile。例如,可以传递以下内容以使用自定义压缩字典进行 Zstandard 解压缩:compression={'method': 'zstd', 'dict_data': my_compression_dict}

在 1.5.0 版本加入: 增加了对 .tar 文件的支持。

Returns:
DataFrame(如果 iterator=False 且 chunksize=None),否则为 SAS7BDATReader
或 XportReader

Examples

>>> df = pd.read_sas("sas_data.sas7bdat")