搜索GPT-3的训练数据

ttvkxqim  于 2023-03-03  发布在  其他
关注(0)|答案(1)|浏览(263)

我正在使用GPT-3进行一些实验,在这些实验中,我用认知科学的测试来提示语言模型。这些测试采用了简短文本片段的形式。现在我想检查GPT-3在训练过程中是否已经遇到过这些文本片段。因此我提出了以下问题:有没有办法筛选GPT-3的训练语料库?可以找出某个字符串是否属于这些语料库吗?
谢谢你的帮忙!

0vvn1miw

0vvn1miw1#

很遗憾,我认为这是不可能的。GPT-3的培训语料库是私有的。
但如果这是可能的,它将是伟大的检测剽窃。也许问它是否知道某一行文字来自哪里?

相关问题