首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
Baichuan-7B
+ 关注
文章:
0
|
问答:
0
|
关注:
0
暂无介绍
文章
|
问答
2
回答
78
浏览
Baichuan-7B 解决爆24G显存的方法
Baichuan-7B
其他
tp5buhyn
4个月前
浏览 (78)
4个月前 
8
回答
88
浏览
Baichuan-7B 给大家一个方便运行的程序代码(cli_demo.py),对多GPU支持更友好些,需要的可以复制过去跑一下
Baichuan-7B
其他
7fhtutme
4个月前
浏览 (88)
4个月前 
8
回答
82
浏览
Baichuan-7B LLaMA-Vicuna-13B 和 Baichuan-Vicuna-7B 的对比评测数据(由GPT4打分,供大家参考)
Baichuan-7B
其他
368yc8dk
4个月前
浏览 (82)
4个月前 
1
回答
60
浏览
Baichuan-7B lm-evaluation-harness中文项目能力测试结果,对比WizardLM[Question]
Baichuan-7B
其他
bvn4nwqk
4个月前
浏览 (60)
4个月前 
5
回答
71
浏览
Baichuan-7B [问题] 重复提问后,回答一直没有改变
Baichuan-7B
其他
0lvr5msh
4个月前
浏览 (71)
4个月前 
1
回答
74
浏览
Baichuan-7B 无法从'transformers.pytorch_utils'导入名称'id_tensor_storage',
Baichuan-7B
其他
c2e8gylq
4个月前
浏览 (74)
4个月前 
3
回答
78
浏览
Baichuan-7B [问题] 两个小问题:没有pad_token && 把不必要的buffer保存下来了
Baichuan-7B
其他
aydmsdu9
4个月前
浏览 (78)
4个月前 
3
回答
93
浏览
Baichuan-7B [问题] 明明内存充足,却显示内存不足,
Baichuan-7B
其他
iq3niunx
4个月前
浏览 (93)
4个月前 
5
回答
98
浏览
Baichuan-7B 是否有embeddings模型释放出来
Baichuan-7B
其他
ha5z0ras
4个月前
浏览 (98)
4个月前 
4
回答
90
浏览
Baichuan-7B 初步完成了多轮对话模型的指令微调
Baichuan-7B
其他
mrzz3bfm
4个月前
浏览 (90)
4个月前 
2
回答
81
浏览
Baichuan-7B [Question] deepspeed 无法使用zero3
Baichuan-7B
其他
qmb5sa22
4个月前
浏览 (81)
4个月前 
3
回答
76
浏览
Baichuan-7B [Question] Lora微调训练的时候报错
Baichuan-7B
其他
qlfbtfca
4个月前
浏览 (76)
4个月前 
4
回答
85
浏览
Baichuan-7B 有关哪个模型推理
Baichuan-7B
其他
l7wslrjt
4个月前
浏览 (85)
4个月前 
1
回答
63
浏览
Baichuan-7B [Question] 数据质量打分模型具体是用什么打的分?
Baichuan-7B
其他
kgsdhlau
4个月前
浏览 (63)
4个月前 
2
回答
68
浏览
[Question] baichuan-7b是否可以支持lora model 合并?
Baichuan-7B
其他
zengzsys
4个月前
浏览 (68)
4个月前 
6
回答
93
浏览
Baichuan-7B [BUG] requirements.txt 依赖冲突
Baichuan-7B
其他
piah890a
4个月前
浏览 (93)
4个月前 
7
回答
99
浏览
Baichuan-7B [问题] 单机单卡训练时,出现错误,无法初始化梯度,
Baichuan-7B
其他
stszievb
4个月前
浏览 (99)
4个月前 
1
回答
88
浏览
Baichuan-7B 请问部署推理时,最小的GPU显存需要多大?以及内存需要多大?[Question]
Baichuan-7B
其他
vsdwdz23
4个月前
浏览 (88)
4个月前 
1
回答
171
浏览
Baichuan-7B [Question] Baichuan模型中的Attention模块为什么在train的时候没有用到attention_mask?
Baichuan-7B
其他
nhaq1z21
4个月前
浏览 (171)
4个月前 
3
回答
81
浏览
Baichuan-7B [Question] 训练垂直领域的模型,增量预训练的token数需要达到多少才能有比较好的效果?
Baichuan-7B
其他
jmo0nnb3
4个月前
浏览 (81)
4个月前 
1
回答
81
浏览
Baichuan-7B [Question] 请问7B没有用上FlashAttention吗?
Baichuan-7B
其他
prdp8dxp
4个月前
浏览 (81)
4个月前 
3
回答
173
浏览
Baichuan-7B [Question] DeepSpeed Zero3 save_checkpoint() got empty mode_states files
Baichuan-7B
Go
a6b3iqyw
4个月前
浏览 (173)
4个月前 
5
回答
145
浏览
Baichuan-7B [BUG] CUDA内存不足,当评估模型时,
Baichuan-7B
其他
y1aodyip
4个月前
浏览 (145)
4个月前 
1
回答
84
浏览
Baichuan-7B [问题] RoPE的实现与论文中的描述不一致,
Baichuan-7B
其他
w3nuxt5m
4个月前
浏览 (84)
4个月前 
1
回答
136
浏览
Baichuan-7B [BUG] 我下载了huggingface上的baichuan7b模型,使用里面的测试程序测试发现CUDA错误,
Baichuan-7B
其他
lsmd5eda
4个月前
浏览 (136)
4个月前 
1
回答
89
浏览
Baichuan-7B [Question]不能安装xformers
Baichuan-7B
其他
m1m5dgzv
4个月前
浏览 (89)
4个月前 
首页
上一页
1
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新问答
更多
xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1)
发布于
3个月前
xxl-job 不能和nacos兼容?
回答(3)
发布于
3个月前
xxl-job 任务执行完后无法结束,日志一直转圈
回答(3)
发布于
2个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1)
发布于
3个月前
xxl-job 参数512字符限制能否去掉
回答(1)
发布于
3个月前