当我索引我的数据它停止在中间,我已经附上截图。一件事我已经注意到的是,当ES不索引,python开始使用交换内存高达50 GB,每次我的索引停止在54%。任何帮助是感激不尽的。谢谢
`
for ok, action in parallel_bulk(
client=client,
index=product_index_name,
actions=actions,
thread_count=4,
request_timeout=100,
chunk_size=100,
raise_on_error=True,
raise_on_exception=True
):
的复数
1条答案
按热度按时间8nuwlpux1#
我已经使用了并行批量,以提高索引速度。而且我有非常非常大的数据集,我减少了。这帮助很大
https://elasticsearch-py.readthedocs.io/en/7.x/helpers.html#elasticsearch.helpers.parallel_bulk