vpfxa7rd1#
int8量化有,uint8是什么鬼
afdcj2ne2#
unsigned int8量化。很多模型用Int8量化后精度损失很大,用Uint8会好很多。
6yjfywim3#
emmmmmmmm,这个就不知道怎么玩了,等大佬来解答吧=。=
7y4bm7vi4#
int8 量化,不取负数?不都是 256 个数的范围么?
tzcvj98z5#
考虑到 zero_point 计算要慢一点,现在就是对称量化 int8 。
fzsnzjdm6#
这是底层实现的问题,看这个: https://zhuanlan.zhihu.com/p/476605320
最后一个 ”why -128 hurt performance“
tct7dpnv7#
@niinorz
7条答案
按热度按时间vpfxa7rd1#
int8量化有,uint8是什么鬼
afdcj2ne2#
unsigned int8量化。很多模型用Int8量化后精度损失很大,用Uint8会好很多。
6yjfywim3#
unsigned int8量化。很多模型用Int8量化后精度损失很大,用Uint8会好很多。
emmmmmmmm,这个就不知道怎么玩了,等大佬来解答吧=。=
7y4bm7vi4#
int8 量化,不取负数?不都是 256 个数的范围么?
tzcvj98z5#
考虑到 zero_point 计算要慢一点,现在就是对称量化 int8 。
fzsnzjdm6#
这是底层实现的问题,看这个: https://zhuanlan.zhihu.com/p/476605320
最后一个 ”why -128 hurt performance“
tct7dpnv7#
@niinorz