No description provided.
rt4zxlrg1#
cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..
这样编译试试 fp16 有没有效果运行时检测需要依赖 linux/android 操作系统的接口,你的平台可能没有?
lmvvr0a82#
您好!当我按照 cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON .. 在aarch64上成功编译后,在fpga上运行显示 segmentation fault 错误;
segmentation fault
我是通过根文件系统烧录至FPGA中去的,至于您说的这个运行时检测需要依赖 linux/android 操作系统的接口,需要哪些东西支持?我是否有办法可以跳过检测?因为我确定这边FPGA上是支持fp16指令的。
8yoxcaq73#
load_param前设置
opt.use_fp16_storage = false; opt.use_fp16_arithmetic = false;
n3schb8v4#
您好,我使用-DNCNN_ARM82=OFF似乎也能达到关闭fp16推断的效果?我想要在FPGA上测试fp16的加速效果,最新版本会在受支持的平台上自动启用fp16推断?但和我使用了cmake选项-DNCNN_ARM82=OFF关闭fp16后的版本跑出来的时间差不多,我还需要做哪些方面的更改呢?我是在aarch64机器上编译完成后放FPGA上运行的
4条答案
按热度按时间rt4zxlrg1#
cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..
这样编译试试 fp16 有没有效果
运行时检测需要依赖 linux/android 操作系统的接口,你的平台可能没有?
lmvvr0a82#
cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..
这样编译试试 fp16 有没有效果
运行时检测需要依赖 linux/android 操作系统的接口,你的平台可能没有?
您好!当我按照
cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..
在aarch64上成功编译后,在fpga上运行显示segmentation fault
错误;我是通过根文件系统烧录至FPGA中去的,至于您说的这个运行时检测需要依赖 linux/android 操作系统的接口,需要哪些东西支持?我是否有办法可以跳过检测?因为我确定这边FPGA上是支持fp16指令的。
8yoxcaq73#
load_param前设置
n3schb8v4#
您好,我使用-DNCNN_ARM82=OFF似乎也能达到关闭fp16推断的效果?我想要在FPGA上测试fp16的加速效果,最新版本会在受支持的平台上自动启用fp16推断?但和我使用了cmake选项-DNCNN_ARM82=OFF关闭fp16后的版本跑出来的时间差不多,我还需要做哪些方面的更改呢?我是在aarch64机器上编译完成后放FPGA上运行的