GPT-3是一个模型还是一个框架?

shyt4zoc  于 2023-03-03  发布在  其他
关注(0)|答案(1)|浏览(218)

我们都听说过GPT-3被称为大型语言模型(LLM),但它真的更像一个框架吗?因为您可以使用GPT-3和自己的数据集来训练自己版本的GPT-3模型。
我的理解是,模型是训练的结果,您可以使用许多框架/库中的一个来训练模型(例如:tensorflow )。如果GPT-3只是一个模型,你就不能用你自己的数据来训练,对吗?所以GPT-3是一个框架?
有人能帮助我更好地理解AI术语吗?

dsekswqp

dsekswqp1#

使用的术语为model
LLM中的模型被定义为语言的数学表示,用于基于概率进行预测。基本上,GPT是通过将作品(标记)转化为数学表示来训练的。在大多数情况下,每个作品由1500个特征数组(在机器学习中称为向量)表示。
在GPT-3的例子中,最新的模型“davinici-003”使用概率来预测它根据所提供的训练给出的响应。
使用GPT-3,您可以微调模型以执行以前未训练过的操作。即使您可以微调它,它仍然被称为模型。

相关问题