[特性]将vllm扩展的Marlin内核回溯移植到autogptq,

hiz5n14c  于 6个月前  发布在  其他
关注(0)|答案(1)|浏览(66)

PR: vllm-project/vllm#3922

  • 添加对更多组大小的支持
  • 添加对desc_act=True(激活重排序)的支持
rur96b6h

rur96b6h1#

这个新的马林核看起来不错。
如果我有时间,我会明天开始着手处理它。

相关问题