vllm [Misc]: 如何直接访问KV缓存?

vh0rcniy  于 4个月前  发布在  其他
关注(0)|答案(4)|浏览(67)

关于vllm的讨论

我正在进行一个实验,该实验涉及在节点之间复制KV缓存的内容。我对代码库不太熟悉,是否有直接访问页面表/KV缓存的方法?从哪里开始?任何建议都是有帮助的!

9wbgstp7

9wbgstp71#

关于这个主题也很好奇,我想在节点之间实现一个简单的请求传输(包括键值缓存)。#2809似乎已经实现了,但仅支持InfiniBand,并且依赖于MSCCL++。

7rfyedvj

7rfyedvj2#

关于这个有任何更新吗?

roejwanj

roejwanj3#

对此也很感兴趣,有人能指导一下最初的几个步骤吗?

qzlgjiam

qzlgjiam4#

请使用cudaIPChandle和cudamemcopy。

相关问题