DeepSpeed-MII 如何获取生成文本的logitTensor?

icnyk63a  于 2个月前  发布在  Git
关注(0)|答案(4)|浏览(49)

你好,非常感谢你提供这个优秀的库。我似乎无法弄清楚如何在生成时获取token的logit值。实际上,我只想要获取每个请求生成的第一个token(即max_new_tokens=1)的logit值,而不是获取采样的token。你是如何做到这一点的?
例如,对于"yes"和"no"这些特定的token,如何在生成的序列中检索这些特定token的logit值?

quhf5bfb

quhf5bfb1#

你好,@randomx207,目前MII中没有提供此类功能。我们正在计划路线图上增加更多类似功能。我将在下周某个时候提交PR来添加此功能!

nbewdwxp

nbewdwxp2#

感谢您的更新,并考虑在路线图中添加此功能。我感谢您愿意为此提供PR。期待下周看到您准备的改进!

yzxexxkh

yzxexxkh3#

关于这个有任何更新吗?

yfjy0ee7

yfjy0ee74#

我遇到了同样的问题。这个问题解决了吗?

相关问题