argilla [文档] 向新文档添加教程页面

cgvd09ve  于 23天前  发布在  其他
关注(0)|答案(2)|浏览(31)

请尽可能多地使用这些教程,但这也是一个很好的借口来回顾和重写。
一些需要记住的事情:

  • 首先识别一个实际问题和/或数据集。它不应该是一个玩具示例,而是某人可能会实际搜索的东西。
  • 解释这个数据和模型,强调为什么它们被使用。例如,GliNER适用于零样本命名实体识别,但运行推理成本较高,因此我们可以开始并逐步转向SpanMarker作为成本效益高的一些技巧。
  • 评估用法并展示结果!我们已经优化了RAG管道,所以我们得到了更好的结果。我们已经优化了一个NER模型,现在它可以对X进行分类。

好的例子 https://haystack.deepset.ai/tutorials/27_first_rag_pipeline
您正在编辑的内容已更改。请复制您的编辑并刷新页面。

任务

Beta Give feedback

  1. 使用few-shot setfit和潜在的句子转换器对textcat进行引导。
  2. 使用zero-shot和few-shot gliner以及NER对spancat进行引导。
  3. 使用spaCy-LLM或其他方法(如llama-index、提示工程等)与LLMs一起引导项目(请自由选择您想要的内容)。
  4. 使用句子转换器和批量标记图像/PDF等的多模型项目。
  5. 使用BertTopic和文本描述监控数据、模型和注解器的漂移。
  6. RAG:使用haystack和sentence-transformers优化检索器和重新排序器。
  7. RAG:优化LLMs:haystack和trl。
  8. 使用TRL进行指令调优的LLM:SFT。
  9. 使用TRL进行偏好调优的LLM:DPO。
41ik7eoe

41ik7eoe1#

关于转让的问题,我们应该怎么做?

uidvcgyl

uidvcgyl2#

@nataliaElv move this to 2.1.

相关问题