多年来,我每天都在使用Pandas,并且经常(但不是那么频繁)使用Numpy。大多数时候我会做这样的事情:
import pandas as pd
import numpy as np
字符串
但是[编辑:prior to pandas 2.0 ]也可以直接从Pandas使用Numpy:
df['value'] = pd.np.where(df['date'] > '2020-01-01', 1, 0)
型
有没有人知道这两个选项中的任何一个是否比另一个性能更好?
多年来,我每天都在使用Pandas,并且经常(但不是那么频繁)使用Numpy。大多数时候我会做这样的事情:
import pandas as pd
import numpy as np
字符串
但是[编辑:prior to pandas 2.0 ]也可以直接从Pandas使用Numpy:
df['value'] = pd.np.where(df['date'] > '2020-01-01', 1, 0)
型
有没有人知道这两个选项中的任何一个是否比另一个性能更好?
2条答案
按热度按时间kwvwclae1#
pandas.np
在Pandas 2.0.0中被删除,以前在Pandas 1.0.0中被弃用:字符串
但值得注意的是,您可以检查它是否是源代码中的同一个模块。
xpcnnkqh2#
两者都导入相同的库。不应该有任何性能差异。它只是同一代码的别名。但是,
np.array
比pd.np.array
更好,因为它可以节省三个字符输入。