vllm [Bug]:在对话结束后重复打印< | im_end |>< | im_start |>

fcwjkofz 于 5个月前发布在其他

关注(0)|答案(7)|浏览(84)

当前环境

docker run --rm --runtime nvidia --gpus all  --name vllm-qwen72b     -v  ~/.cache/huggingface:/root/.cache/huggingface    \
   -v /data1/Download/models/Qwen-72B-Chat-Int4:/data/shared/Qwen/Qwen-Chat     -p 8901:8000     --ipc=host  \
   vllm/vllm-openai:latest --model /data/shared/Qwen/Qwen-Chat     --max-model-len 6400  --trust-remote-code  --tensor-parallel-size 2  \
   --gpu-memory-utilization 0.9  --served-model-name qwen72b --api-key "xxxx"

🐛 描述问题

在Docker环境中运行模型时，我遇到了一个问题。模型是Qwen-72B,对话无法正常结束。

来源：https://github.com/vllm-project/vllm/issues/4251

7条答案

按热度按时间

使用vllm+chatglm3+oneapi+fastgpt时也存在同样的问题。不确定是哪个部分出了问题。

赞(0）回复(0）举报 5个月前

应该是vllm的问题，目前还没找到解决办法，有办法了麻烦踢我一下

赞(0）回复(0）举报 5个月前

我也是，看到有个类似的解决办法，但不知道在vllm中怎么修改：https://zhuanlan.zhihu.com/p/695477673

赞(0）回复(0）举报 5个月前

我的问题已经解决了。我是通过使用oneapi接入了fastgpt,然后在fastgpt的配置文件中添加了结束参数| im_end |,这样就解决了问题。

赞(0）回复(0）举报 5个月前

你好，我不太明白你的问题。你是在使用oneapi接入fastgpt吗？如果是的话，你可以在fastgpt的配置文件中加上结束的参数 | im_end |来解决问题。

赞(0）回复(0）举报 5个月前

"defaultConfig":{"stop": "<|im_end|>"}

赞(0）回复(0）举报 5个月前

我是在请求时通过添加停止符的tokenId来解决的。

赞(0）回复(0）举报 5个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前