Paddle add pir decoder_attention_fuse_pass

gmol1639  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(24)

需求描述 Feature Description

任务目标: 新增decoder_attention_fuse_pass;
需求场景: decoder模型性能优化;
功能描述: 新增 decoder attention 融合的pir pass, 该pass将q k v 的计算融合成一个大算子运算(不带mask)

替代实现 Alternatives

No response

ruarlubt

ruarlubt1#

您好,感谢您的pr,CI通过后联系相关同学帮忙review下

相关问题