vllm [Bug]: DynamicNTKScalingRotaryEmbedding的实现可能存在错误,

e37o9pze 于 6个月前发布在其他

关注(0)|答案(3)|浏览(43)

当前环境

The output of `python collect_env.py`

我注意到动态ntk的实现为所有长度重新计算了基础参数，这与transformers的实现不一致？

🐛 描述bug

def _compute_cos_sin_cache(self) -> torch.Tensor:

NOTE(woosuk): self.max_position_embeddings是应用rope缩放之前的原始最大长度。

因此，在应用rope缩放后的最大长度为self.max_position_embeddings * self.scaling_factor。

来源：https://github.com/vllm-project/vllm/issues/5093

3条答案

按热度按时间

是的，我注意到了类似的问题。当前的动态NTK缩放实际上是静态NTK缩放。对于需要处理大量并发请求的模型服务器来说，实现动态NTK可能会变得棘手且低效。

赞(0）回复(0）举报 6个月前

+1

赞(0）回复(0）举报 6个月前

+1

赞(0）回复(0）举报 6个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前