参考https://blog.csdn.net/weixin_45449540/article/details/107704028 教程
make 成功, 其余的流程全部走成功 但是 走到编译
activation_op.dir/activation_op.cu.o
报错 error 139 并且 core dumped 试过很多次
swap 也分配了20g
NAME TYPE SIZE USED PRIO
/var/swapfile file 20G 19.3M -1
/dev/zram0 partition 495.4M 146.4M 5
/dev/zram1 partition 495.4M 146.8M 5
/dev/zram2 partition 495.4M 147M 5
/dev/zram3 partition 495.4M 146.7M 5
但是在编译 总是出错。出现 core dumped 问题 卡了好几天了.
也将make -j4 变成 make -j1 还是不行
[ 30%] Building CUDA object paddle/fluid/operators/CMakeFiles/activation_op.dir/activation_op.cu.o
/activation_op.dir/activation_op.cu.oSegmentation fault (core dumped)
paddle/fluid/operators/CMakeFiles/activation_op.dir/build.make:110: recipe for target 'paddle/fluid/operators/CMakeFiles/activation_op.dir/activation_op.cu.o' failed
make[2]:***[paddle/fluid/operators/CMakeFiles/activation_op.dir/activation_op.cu.o] Error 139
CMakeFiles/Makefile2:48037: recipe for target 'paddle/fluid/operators/CMakeFiles/activation_op.dir/all' failed
make[1]:***[paddle/fluid/operators/CMakeFiles/activation_op.dir/all] Error 2
Makefile:129: recipe for target 'all' failed
14条答案
按热度按时间tct7dpnv1#
您好,我们已经收到了您的问题,会安排技术人员尽快解答您的问题,请耐心等待。请您再次检查是否提供了清晰的问题描述、复现代码、环境&版本、报错信息等。同时,您也可以通过查看官网API文档、常见问题、历史Issue、AI社区来寻求解答。祝您生活愉快~
Hi! We've received your issue and please be patient to get responded. We will arrange technicians to answer your questions as soon as possible. Please make sure that you have posted enough message to demo your request. You may also check out the API,FAQ,Github Issue and AI community to get the answer.Have a nice day!
qvtsj1bj2#
您好,您编译时的报错可能发生在较前的位置,可否发下完整的log
wn9m85ua3#
请问下,完整的编译log在哪里看?我试着导出来。 这个139的error信息里没有写 log地址
50pmv0ei4#
可以将完整log保存在nohup.out里
vq8itlhq5#
日志:
mfpqipee6#
cmake指令你改一下:
cmake .. -DWITH_CONTRIB=OFF -DWITH_MKL=OFF -DWITH_MKLDNN=OFF -DWITH_TESTING=OFF -DCMAKE_BUILD_TYPE=Release -DON_INFER=ON -DWITH_PYTHON=ON -DPY_VERSION=3.6 -DWITH_XBYAK=OFF -DWITH_NV_JETSON=ON -DWITH_TENSORRT=ON -DTENSORRT_ROOT=/usr -DCMAKE_CUDA_COMPILER=/usr/local/cuda-10.0/bin/nvcc -DWITH_NCCL=OFF -DCUDA_ARCH_NAME=Auto
如果是 jetpack4.4或4.5系统的 -DCMAKE_CUDA_COMPILER 中的 cuda-10.0改为10.2xghobddn7#
按照您提到的cmake 发现这个错误
graph_to_program_pass.dir 中 depend.make没有内容是这样的
cbjzeqam8#
@Wall-ee 请问您是develop分支吗?你切换到 v2.0.1分支
l5tcr1uw9#
现在用的是2.0.0我切到 2.0.1试一下
beq87vna10#
好像没找到2.0.1 只有release 2.0?
a9wyjsp711#
你换到tag,或者输入git checkout v2.0.1
6ss1mwsb12#
成功了!!整整3周,哈哈,终于搞定了,几个细节。
1,配置的时候,如果已经编译了nccl 一定要 nccl 要开成on
2,把里面的所有的关于最近github的clone 都替换为可用的下载
3,关于编译文件中,补丁的下载地址也要处理一下
ckocjqey13#
Are you satisfied with the resolution of your issue?
YES
No
qyuhtwio14#
但是编译后 的python 安装文件又出问题了 出现这个:
报告zipfile 问题