在python中panda中pd.read_csv()
方法的文档中,当描述“sep”参数时,提到了C引擎和Python引擎等引擎。
文档链接为:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
这些引擎是什么?每个引擎的作用是什么?有没有什么类比可以帮助更好地理解这些引擎?
在python中panda中pd.read_csv()
方法的文档中,当描述“sep”参数时,提到了C引擎和Python引擎等引擎。
文档链接为:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
这些引擎是什么?每个引擎的作用是什么?有没有什么类比可以帮助更好地理解这些引擎?
2条答案
按热度按时间zi8p0yeb1#
pd.read_csv
文档说明了'c'(默认)和'python'引擎之间的具体区别。名称表示编写解析器的语言。具体来说,文档说明了:在可能的情况下,panda使用C解析器(指定为
engine='c'
),但如果指定了C不支持的选项,则可能会退回到Python。以下是您应该注意的主要差异(自v0.23.4起):
*'c'更快,而'python'目前功能更完整。
skipfooter
**,而“c”不支持。sep
**,而不是单个字符(inc regex),而“c”不支持。*'python'支援
sep=None
搭配delim_whitespace=False
,这表示它可以自动侦测分隔符号,而'c'则不行。*'c'支持
float_precision
,而'python'不支持(或不需要)。版本注解:
***
dtype
**在“Python”版本0.20.0及更高版本中受支持。***
delim_whitespace
**在“Python”版本0.18.1及更高版本中支持。请注意,以上 * 可能 * 会随着功能的开发而改变。如果在以后的版本中看到意外的行为,您应该检查IO工具(文本、CSV、HDF5 ...)。
aydmsdu92#
我在
pandas
engine
选项上的timeit
。是的!c
比python
快得多,但是,甚至令人惊讶的是,不使用引擎要快得多。以下是导入相同数据时的结果: