以convolution层为例进行问题描述:
对于input_blob进行在线的量化,然后和已经量化的weight_data进行乘法操作,然后将int32反量化为fp32再和bias进行加法操作得到top_blob.
gev0vcfq1#
@nihui ,希望老板能够帮忙解惑,谢谢
nwlqm0z12#
两种量化模式,如果全是int型计算,中间过程就不在反量化。
2条答案
按热度按时间gev0vcfq1#
@nihui ,希望老板能够帮忙解惑,谢谢
nwlqm0z12#
两种量化模式,如果全是int型计算,中间过程就不在反量化。