在我的代码中,我必须对unordered_map中的所有元素进行操作,为了加速这个过程,我想使用OpenMP,但是这种简单的方法不起作用:
std::unordered_map<size_t, double> hastTable;
#pragma omp for
for(auto it = hastTable.begin();
it != hastTable.end();
it ++){
//do something
}
这是因为unordered_map的迭代器不是随机访问迭代器,作为一种替代方法,我尝试了__gnu_parallel指令来处理for_each,但是下面的代码
#include <parallel/algorithm>
#include <omp.h>
__gnu_parallel::for_each (hashTable.begin(), hashTable.end(),[](std::pair<const size_t, double> & item)
{
//do something with item.secon
});
汇编依据(gcc 4.8.2)
g++ -fopenmp -march=native -std=c++11
使用向量切换unordered_map并使用相同的__gnu_parallel指令是并行运行的。
在无序Map的情况下,为什么不并行运行?有解决方法吗?
在下面我给予你一些简单的代码,它重现了我的问题。
#include <unordered_map>
#include <parallel/algorithm>
#include <omp.h>
int main(){
//unordered_map
std::unordered_map<size_t, double> hashTable;
double val = 1.;
for(size_t i = 0; i<100000000; i++){
hashTable.emplace(i, val);
val += 1.;
}
__gnu_parallel::for_each (hashTable.begin(), hashTable.end(),[](std::pair<const size_t, double> & item)
{
item.second *= 2.;
});
//vector
std::vector<double> simpleVector;
val = 1.;
for(size_t i = 0; i<100000000; i++){
simpleVector.push_back(val);
val += 1.;
}
__gnu_parallel::for_each (simpleVector.begin(), simpleVector.end(),[](double & item)
{
item *= 2.;
});
}
我期待着你的答案。
4条答案
按热度按时间92vpleto1#
对于不支持随机迭代器的容器,规范方法是使用显式OpenMP任务:
这为每个迭代创建了一个单独的任务,这带来了一些开销,因此只有当
//do something
实际上意味着//do quite a bit of work
时才有意义。7cwmlq892#
您可以在bucket索引的范围内拆分循环,然后创建一个bucket内迭代器来处理元素。
unordered_map
有.bucket_count()
和特定于bucket的迭代器begin(bucket_number)
、end(bucket_number)
,它们允许这样做。假设您没有修改1.0的默认max_load_factor()
,并且有一个合理的散列函数,您将 * 平均 * 每个桶1个元素,不应该在空桶上浪费太多时间。mpbci0fu3#
您可以通过在
unordered_map
的存储桶上进行迭代来完成此操作,如下所示:tcomlyy64#
对于具有大型类对象的容器,这种方法似乎更容易理解