我们都听说过GPT-3被称为大型语言模型(LLM),但它真的更像一个框架吗?因为您可以使用GPT-3和自己的数据集来训练自己版本的GPT-3模型。我的理解是,模型是训练的结果,您可以使用许多框架/库中的一个来训练模型(例如:tensorflow )。如果GPT-3只是一个模型,你就不能用你自己的数据来训练,对吗?所以GPT-3是一个框架?有人能帮助我更好地理解AI术语吗?
dsekswqp1#
使用的术语为model。LLM中的模型被定义为语言的数学表示,用于基于概率进行预测。基本上,GPT是通过将作品(标记)转化为数学表示来训练的。在大多数情况下,每个作品由1500个特征数组(在机器学习中称为向量)表示。在GPT-3的例子中,最新的模型“davinici-003”使用概率来预测它根据所提供的训练给出的响应。使用GPT-3,您可以微调模型以执行以前未训练过的操作。即使您可以微调它,它仍然被称为模型。
model
1条答案
按热度按时间dsekswqp1#
使用的术语为
model
。LLM中的模型被定义为语言的数学表示,用于基于概率进行预测。基本上,GPT是通过将作品(标记)转化为数学表示来训练的。在大多数情况下,每个作品由1500个特征数组(在机器学习中称为向量)表示。
在GPT-3的例子中,最新的模型“davinici-003”使用概率来预测它根据所提供的训练给出的响应。
使用GPT-3,您可以微调模型以执行以前未训练过的操作。即使您可以微调它,它仍然被称为模型。