text-generation-inference 功能请求：为添加其他API端点添加文档和示例,

wqnecbli 于 4个月前发布在其他

关注(0)|答案(3)|浏览(56)

功能需求

我希望能够使用支持有界输出的指南或其他库，与HF端点一起使用。
参考：A guidance language for controlling large language models.

动机

我想要使用类似guidance这样的库，通过HF推理端点进行受限制的生成，这样我们就可以使用超过本地计算能力的更大模型。

你的贡献

不知道如何开始为现有的TGI配置添加API端点。

text-generation-inference

来源：https://github.com/huggingface/text-generation-inference/issues/2321

3条答案

按热度按时间

你好，@michael-conrad 🙌
我们通过 outlines 在 TGI 中提供了结构化生成支持。
这会解决你的问题吗？
文档：https://huggingface.co/docs/text-generation-inference/basic_tutorials/using_guidance

赞(0）回复(0）举报 4个月前

See also: guidance-ai/guidance#952

赞(0）回复(0）举报 4个月前

好的，谢谢你指出这个问题👍
有一件事可能需要澄清的是，TGI和推理端点之间是相互独立的。它们是两个独立的东西。

TGI是一个LLM服务器，可以部署在推理端点上，也可以部署为容器到其他云提供商。
你可以将自己的容器部署到推理端点上，TGI只是人们最常用的一个。

所以在这种情况下，我认为添加一个自定义的Inference Handler(也在指导问题中链接)是正确的方法。就本身而言，TGI没有配置来添加新的端点。
这有道理吗？

赞(0）回复(0）举报 4个月前

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 4个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 4个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 4个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 4个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 4个月前