numpy Scipy处理大数据

qoefvg9y 于 2023-01-13 发布在其他

关注(0)|答案(1)|浏览(133)

我有一个只包含一列的数据集（Pandas系列）. Dataset为.dat文件，约有200万行和1列（166 MB）。使用 pd.read_csv 阅读此数据大约需要7-8分钟。此数据是一个信号，需要进行处理（使用scipy.signal）。所以当我处理数据时，我得到了MemoryError。有没有办法加快文件的加载速度并提高其处理速度（scipy.signal.ellip）并绕过内存问题？提前感谢您。加载数据：

data = pd.read_csv('C:/Users/HP/Desktop/Python and programming/Jupyter/Filter/3200_Hz.dat', 
sep='\r\n', header=None, squeeze=True)

数据处理（也需要约7分钟）：

b, a = signal.ellip(4, 5, 40, Wn, 'bandpass', analog=False)
output = signal.filtfilt(b, a, data)
#after that plotting 'output' with plt

输入数据示例：

numpy

来源：https://stackoverflow.com/questions/50667003/scipy-processing-large-data

1条答案

按热度按时间

rt4zxlrg1#

将'\r\n'设置为分隔符，这意味着（如果我理解正确的话）每一行等于一个新列，这意味着最终将有数百万列，而squeeze参数没有任何作用。
不要设置sep参数（保留其默认值）：换行符将分隔记录，然后squeeze将其返回到Series中。

赞(0）回复(0）举报 2023-01-13

我来回答

numpy Scipy处理大数据

1条答案

相关问题

热门标签

最新问答