Chinese-CLIP 数据准备格式疑问

holgip5t  于 2个月前  发布在  其他
关注(0)|答案(1)|浏览(35)

将训练/验证/测试图片以base64形式分别存放在${split}_imgs.tsv文件中。文件每行表示一张图片,包含图片id(int型)与图片base64,以tab隔开,格式如下:
图片id base64
1000002 /9j/4AAQSkZJ...YQj7314oA//2Q==
文本信息及图文对匹配关系则保存在${split}_texts.jsonl文件。文件每行是一行json,格式如下:
{"text_id": 8428, "text": "高级感托特包斜挎", "image_ids": [1076345, 517602]}

**请问image_ids是等于图片id吗??还是图片名字??

images_ids和图片id有区别吗?**

iq0todco

iq0todco1#

我所理解的没有区别,这就是一个图片的索引,方便图文对齐,也为了后续测试的时候可以看看召回的top里面是否有正确的答案。

相关问题