我想测试fp16的加速效果,如何生成fp16版本的benchncnn而不是让他自动启用fp16推断,我测试了NCNN_ARM82=OFF的版本与原始版本无差异,我该如何知道fp16指令起作用了?

kkbh8khc  于 5个月前  发布在  其他
关注(0)|答案(4)|浏览(49)

No description provided.

rt4zxlrg

rt4zxlrg1#

cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..

这样编译试试 fp16 有没有效果
运行时检测需要依赖 linux/android 操作系统的接口,你的平台可能没有?

lmvvr0a8

lmvvr0a82#

cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON ..

这样编译试试 fp16 有没有效果
运行时检测需要依赖 linux/android 操作系统的接口,你的平台可能没有?

您好!当我按照 cmake -DNCNN_RUNTIME_CPU=OFF -DNCNN_ARM82=ON -DNCNN_ARM82DOT=ON .. 在aarch64上成功编译后,在fpga上运行显示 segmentation fault 错误;

我是通过根文件系统烧录至FPGA中去的,至于您说的这个运行时检测需要依赖 linux/android 操作系统的接口,需要哪些东西支持?我是否有办法可以跳过检测?因为我确定这边FPGA上是支持fp16指令的。

8yoxcaq7

8yoxcaq73#

load_param前设置

opt.use_fp16_storage = false;
opt.use_fp16_arithmetic = false;
n3schb8v

n3schb8v4#

您好,我使用-DNCNN_ARM82=OFF似乎也能达到关闭fp16推断的效果?我想要在FPGA上测试fp16的加速效果,最新版本会在受支持的平台上自动启用fp16推断?但和我使用了cmake选项-DNCNN_ARM82=OFF关闭fp16后的版本跑出来的时间差不多,我还需要做哪些方面的更改呢?我是在aarch64机器上编译完成后放FPGA上运行的

相关问题