首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
inference
+ 关注
文章:
0
|
问答:
3
|
关注:
0
暂无介绍
文章
|
问答
3
回答
60
浏览
inference 在启动内置模型时支持自定义模型权重目录
inference
其他
sirbozc5
5个月前
浏览 (60)
5个月前 
2
回答
54
浏览
inference 当我使用src模型scope启动jina时,发现这个bug:https://huggingface.co'无法加载此文件,因为在缓存文件中找不到它,看起来jinaai/jina-bert-implementation不是包含名为configuration_bert.py的文件的目录路径,
inference
其他
kpbwa7wx
5个月前
浏览 (54)
5个月前 
4
回答
64
浏览
inference CUDA错误:无效的参数 CUDA内核错误可能会在某些其他API调用中异步报告,因此下面的堆栈跟踪可能不正确,为了调试,请考虑传递CUDA_LAUNCH_BLOCKING=1,使用TORCH_USE_CUDA_DSA编译以启用设备端Assert,
inference
其他
nkkqxpd9
5个月前
浏览 (64)
5个月前 
7
回答
63
浏览
根据官网要求,通过K8s集群部署kbcli addon enable xinference时提示not found,
inference
其他
lnvxswe2
5个月前
浏览 (63)
5个月前 
2
回答
62
浏览
inference 关于对MLX UI界面问题的支
inference
其他
lqfhib0f
5个月前
浏览 (62)
5个月前 
1
回答
61
浏览
inference 增加 embedding 模型默认输出未归一化的向量
inference
其他
nhn9ugyo
5个月前
浏览 (61)
5个月前 
1
回答
43
浏览
支持特征中的MInference,
inference
其他
xzlaal3s
5个月前
浏览 (43)
5个月前 
7
回答
45
浏览
inference 升级vllm和sglang到新版本并正确支持gemma模型
inference
其他
vatpfxk5
5个月前
浏览 (45)
5个月前 
1
回答
48
浏览
inference 在注册自定义模型后,测试页面不可用,
inference
其他
z9gpfhce
5个月前
浏览 (48)
5个月前 
2
回答
43
浏览
inference max_new_tokens(=512)和max_length(=518)似乎都已设置,max_new_tokens将优先考虑,请参阅文档以获取更多信息,
inference
其他
mbyulnm0
5个月前
浏览 (43)
5个月前 
4
回答
208
浏览
inference 启动失败,基础镜像从pytorch/pytorch:2.1.2-cuda12.1-cudnn8-devel切换到vllm/vllm-openai:latest时出错,
inference
其他
yyhrrdl8
5个月前
浏览 (208)
5个月前 
2
回答
56
浏览
inference 支持IPU加速吗?
inference
其他
sxissh06
5个月前
浏览 (56)
5个月前 
1
回答
50
浏览
xinference微调模型的支持
inference
其他
hc8w905p
5个月前
浏览 (50)
5个月前 
2
回答
317
浏览
inference 使用最新的GLM-4聊天9b模型进行推理失败,
inference
其他
bsxbgnwa
5个月前
浏览 (317)
5个月前 
1
回答
60
浏览
inference v1/completions接口无法使用,返回空字符串
inference
其他
hk8txs48
5个月前
浏览 (60)
5个月前 
2
回答
44
浏览
inference 显示启动模型失败,load失败
inference
其他
9vw9lbht
5个月前
浏览 (44)
5个月前 
1
回答
51
浏览
inference 建议新增对图嵌入模型的支持,
inference
其他
pbpqsu0x
5个月前
浏览 (51)
5个月前 
7
回答
55
浏览
当使用xinference的API服务调用时,如果请求过多,xinference本地API会直接卡死,
inference
其他
7kqas0il
5个月前
浏览 (55)
5个月前 
1
回答
39
浏览
inference 注意力掩码大小不匹配错误和输入选择的问题
inference
其他
7lrncoxx
5个月前
浏览 (39)
5个月前 
1
回答
43
浏览
inference 关于注册自定义模型的prompt_style参数说明
inference
其他
hyrbngr7
5个月前
浏览 (43)
5个月前 
1
回答
47
浏览
inference ui界面可以支持audio模型 指定worker启动吗
inference
其他
oyxsuwqo
5个月前
浏览 (47)
5个月前 
1
回答
50
浏览
inference 增加embedding多卡分布式部署能力
inference
其他
gpfsuwkq
5个月前
浏览 (50)
5个月前 
1
回答
53
浏览
k8s拉起xinference能够pod,running,但是内置的模型,不能运行起来;但是手动进入pod里面,执行命令后,能够把模型运行起来,显存成功占用,是为什么
inference
其他
qlvxas9a
5个月前
浏览 (53)
5个月前 
5
回答
51
浏览
【Reranker建议】xinference的页面端建议支持半精度启动reranker
inference
其他
iecba09b
5个月前
浏览 (51)
5个月前 
1
回答
54
浏览
xinference 在cuda118环境下可以安装使用吗?
inference
其他
txu3uszq
5个月前
浏览 (54)
5个月前 
1
回答
82
浏览
inference 启动自定义模型失败,显示"No such file or directory: '/D:/Pretrainedmodels3/ZhipuAI/chat4/glm-4-9b-chat' -> '/home/chat4/glm-4-9b-chat'",
inference
其他
db2dz4w8
5个月前
浏览 (82)
5个月前 
1
回答
43
浏览
xinference api调用报错 Fast Chat AI error:{"detail":"方法不允许"}
inference
其他
pgx2nnw8
5个月前
浏览 (43)
5个月前 
2
回答
53
浏览
xinference启动一段时间后,embedding API访问异常,错误详情:[地址=0.0.0.0:37167,进程ID=193948] [Errno 5] 输入/输出错误,
inference
其他
wwwo4jvm
5个月前
浏览 (53)
5个月前 
2
回答
40
浏览
inference rerank模型启动时,页面支持选择use_fp16参数
inference
其他
f45qwnt8
5个月前
浏览 (40)
5个月前 
2
回答
88
浏览
inference qwen1.5-moe-chat模型加载失败
inference
其他
2eafrhcq
5个月前
浏览 (88)
5个月前 
首页
上一页
1
2
3
4
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新问答
更多
xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1)
发布于
3个月前
xxl-job 不能和nacos兼容?
回答(3)
发布于
3个月前
xxl-job 任务执行完后无法结束,日志一直转圈
回答(3)
发布于
3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1)
发布于
3个月前
xxl-job 参数512字符限制能否去掉
回答(1)
发布于
3个月前