pypy pandas关联比python慢

bxjv4tth 于 2023-05-12 发布在 Python

关注(0)|答案(1)|浏览(165)

我只是想给予使用PyPy进行pandas操作，我想使用PyPy的某些代码可能会更快，但显然它比python慢。
这背后的原因是什么？
这是我的代码示例，只是从csv读取示例数据并计算相关性。
Python：7分钟
使用pypy：8.5分钟

import pandas as pd
import time

t = time.time()

df = pd.read_csv('./dfn.csv', index_col=0)

df.T.corr()

print(time.time()-t)

pandas

来源：https://stackoverflow.com/questions/76217127/pypy-pandas-correlation-slower-than-python

1条答案

按热度按时间

eqqqjvef1#

大部分科学Python软件栈实际上是用C/C编写的。因此，当你使用pandas例程，如read_csv或T.corr()时，你不是在访问python代码，而是编译后的代码。PyPy不能加快代码的速度。此外，C/C代码的接口目前使用CPython C-API编写。为了让PyPy使用该代码，它必须模拟CPython C-API，这是很慢的。blog post的原因。我们希望HPy能够改变这种情况，使PyPy（和其他python实现）上的C/C++互操作更快。

赞(0）回复(0）举报 2023-05-12

我来回答

pypy pandas关联比python慢

1条答案

相关问题

热门标签

最新问答