首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
Baichuan-7B
+ 关注
文章:
0
|
问答:
0
|
关注:
0
暂无介绍
文章
|
问答
2
回答
92
浏览
Baichuan-7B 解决爆24G显存的方法
Baichuan-7B
其他
tp5buhyn
5个月前
浏览 (92)
5个月前 
8
回答
90
浏览
Baichuan-7B 给大家一个方便运行的程序代码(cli_demo.py),对多GPU支持更友好些,需要的可以复制过去跑一下
Baichuan-7B
其他
7fhtutme
5个月前
浏览 (90)
5个月前 
8
回答
85
浏览
Baichuan-7B LLaMA-Vicuna-13B 和 Baichuan-Vicuna-7B 的对比评测数据(由GPT4打分,供大家参考)
Baichuan-7B
其他
368yc8dk
5个月前
浏览 (85)
5个月前 
1
回答
61
浏览
Baichuan-7B lm-evaluation-harness中文项目能力测试结果,对比WizardLM[Question]
Baichuan-7B
其他
bvn4nwqk
5个月前
浏览 (61)
5个月前 
5
回答
83
浏览
Baichuan-7B [问题] 重复提问后,回答一直没有改变
Baichuan-7B
其他
0lvr5msh
5个月前
浏览 (83)
5个月前 
1
回答
79
浏览
Baichuan-7B 无法从'transformers.pytorch_utils'导入名称'id_tensor_storage',
Baichuan-7B
其他
c2e8gylq
5个月前
浏览 (79)
5个月前 
3
回答
85
浏览
Baichuan-7B [问题] 两个小问题:没有pad_token && 把不必要的buffer保存下来了
Baichuan-7B
其他
aydmsdu9
5个月前
浏览 (85)
5个月前 
3
回答
99
浏览
Baichuan-7B [问题] 明明内存充足,却显示内存不足,
Baichuan-7B
其他
iq3niunx
5个月前
浏览 (99)
5个月前 
5
回答
109
浏览
Baichuan-7B 是否有embeddings模型释放出来
Baichuan-7B
其他
ha5z0ras
5个月前
浏览 (109)
5个月前 
4
回答
92
浏览
Baichuan-7B 初步完成了多轮对话模型的指令微调
Baichuan-7B
其他
mrzz3bfm
5个月前
浏览 (92)
5个月前 
2
回答
79
浏览
Baichuan-7B [Question] deepspeed 无法使用zero3
Baichuan-7B
其他
qmb5sa22
5个月前
浏览 (79)
5个月前 
3
回答
75
浏览
Baichuan-7B [Question] Lora微调训练的时候报错
Baichuan-7B
其他
qlfbtfca
5个月前
浏览 (75)
5个月前 
4
回答
91
浏览
Baichuan-7B 有关哪个模型推理
Baichuan-7B
其他
l7wslrjt
5个月前
浏览 (91)
5个月前 
1
回答
62
浏览
Baichuan-7B [Question] 数据质量打分模型具体是用什么打的分?
Baichuan-7B
其他
kgsdhlau
5个月前
浏览 (62)
5个月前 
2
回答
74
浏览
[Question] baichuan-7b是否可以支持lora model 合并?
Baichuan-7B
其他
zengzsys
5个月前
浏览 (74)
5个月前 
6
回答
98
浏览
Baichuan-7B [BUG] requirements.txt 依赖冲突
Baichuan-7B
其他
piah890a
5个月前
浏览 (98)
5个月前 
7
回答
104
浏览
Baichuan-7B [问题] 单机单卡训练时,出现错误,无法初始化梯度,
Baichuan-7B
其他
stszievb
5个月前
浏览 (104)
5个月前 
1
回答
92
浏览
Baichuan-7B 请问部署推理时,最小的GPU显存需要多大?以及内存需要多大?[Question]
Baichuan-7B
其他
vsdwdz23
5个月前
浏览 (92)
5个月前 
1
回答
169
浏览
Baichuan-7B [Question] Baichuan模型中的Attention模块为什么在train的时候没有用到attention_mask?
Baichuan-7B
其他
nhaq1z21
5个月前
浏览 (169)
5个月前 
3
回答
95
浏览
Baichuan-7B [Question] 训练垂直领域的模型,增量预训练的token数需要达到多少才能有比较好的效果?
Baichuan-7B
其他
jmo0nnb3
5个月前
浏览 (95)
5个月前 
1
回答
94
浏览
Baichuan-7B [Question] 请问7B没有用上FlashAttention吗?
Baichuan-7B
其他
prdp8dxp
5个月前
浏览 (94)
5个月前 
3
回答
167
浏览
Baichuan-7B [Question] DeepSpeed Zero3 save_checkpoint() got empty mode_states files
Baichuan-7B
Go
a6b3iqyw
5个月前
浏览 (167)
5个月前 
5
回答
135
浏览
Baichuan-7B [BUG] CUDA内存不足,当评估模型时,
Baichuan-7B
其他
y1aodyip
5个月前
浏览 (135)
5个月前 
1
回答
86
浏览
Baichuan-7B [问题] RoPE的实现与论文中的描述不一致,
Baichuan-7B
其他
w3nuxt5m
5个月前
浏览 (86)
5个月前 
1
回答
138
浏览
Baichuan-7B [BUG] 我下载了huggingface上的baichuan7b模型,使用里面的测试程序测试发现CUDA错误,
Baichuan-7B
其他
lsmd5eda
5个月前
浏览 (138)
5个月前 
1
回答
95
浏览
Baichuan-7B [Question]不能安装xformers
Baichuan-7B
其他
m1m5dgzv
5个月前
浏览 (95)
5个月前 
首页
上一页
1
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新问答
更多
xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1)
发布于
4个月前
xxl-job 不能和nacos兼容?
回答(3)
发布于
4个月前
xxl-job 任务执行完后无法结束,日志一直转圈
回答(3)
发布于
3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1)
发布于
4个月前
xxl-job 参数512字符限制能否去掉
回答(1)
发布于
4个月前