我正在测试OpenAI的不同模型,我注意到并不是所有的模型都被开发或训练得足以给予可靠的响应。
我测试的模型如下:
model_engine = "text-davinci-003"
model_engine = "davinci"
model_engine = "curie"
model_engine = "babbage"
model_engine = "ada"
我需要了解davinci
和text-davinci-003
之间的区别,以及如何在使用ChatGPT时改进响应以匹配该响应。
2条答案
按热度按时间lxkprmvk1#
我将用Yao Fu yao.fu@ed.ac.uk的这篇精彩的视觉摘要来补充Rok Benko的答案:
a14dhokn2#
TL;DR
text-davinci-003
是更新、功能更强的型号text-davinci-003
支持更长的上下文窗口(即4097个令牌)text-davinci-003
是在更新的数据集上训练的gpt-3.5-turbo
和gpt-4
甚至比text-davinci-003
更强大正如官方的OpenAI article所述:
虽然
davinci
和text-davinci-003
都是强大的models,但它们在一些关键方面有所不同。text-davinci-003
是更新且功能更强大的型号,专为instruction-following任务设计。这使其能够简洁和更准确地响应-即使在零射击场景中,即而不需要提示中给出的任何示例。另一方面,davinci
可以在特定任务上进行微调,如果您可以访问至少几百个训练示例,则可以使其非常有效。此外,
text-davinci-003
支持比davinci - 4097令牌更长的上下文窗口(最大提示+完成长度),而davinci
支持2049。最后,
text-davinci-003
在一个更新的数据集上进行了训练,其中包含截至2021年6月的数据。这些更新,沿着对Inserting text的支持,使text-davinci-003
成为我们推荐用于大多数用例的特别多功能和强大的模型。使用
text-davinci-003
是因为您在问题中提到的其他型号功能较弱。ChatGPT目前对非订阅用户使用
text-davinci-002
。如果您购买ChatGPT Plus订阅,您也可以使用gpt-3.5-turbo
或gpt-4
。因此,要获得与ChatGPT相似的响应,这取决于您是否订阅。当然,gpt-3.5-turbo
和gpt-4
比text-davinci-003
更强大。