任务目标: 新增decoder_attention_fuse_pass;需求场景: decoder模型性能优化;功能描述: 新增 decoder attention 融合的pir pass, 该pass将q k v 的计算融合成一个大算子运算(不带mask)
No response
ruarlubt1#
您好,感谢您的pr,CI通过后联系相关同学帮忙review下
1条答案
按热度按时间ruarlubt1#
您好,感谢您的pr,CI通过后联系相关同学帮忙review下