跳到内容

Steps 库

类别概览

库页面展示了 distilabel 中不同类型的组件。

图标 类别 描述
text-generation 文本生成 steps 用于根据给定的提示生成文本。
chat-generation 聊天生成 steps 用于根据对话生成文本。
text-classification 文本分类 steps 用于将文本分类到某个类别。
text-manipulation 文本操作 steps 用于操作或重写输入文本。
evol Evol steps 用于重写输入文本并将其演变为更高质量。
critique Critique steps 用于提供关于数据质量的反馈,并附带书面解释。
scorer Scorer steps 用于评估数据并用数值进行评分。
preference Preference steps 用于收集关于数据的偏好,使用数值或排名。
embedding Embedding steps 用于为数据生成 embeddings。
clustering Clustering steps 用于将相似的数据点分组在一起。
columns Columns steps 用于操作数据中的列。
filtering Filtering steps 用于根据某些标准过滤数据。
format Format steps 用于格式化数据。
load Load steps 用于加载数据。
execution 执行 python 函数。
save Save steps 用于保存数据。
image-generation 图像生成 steps 用于根据给定的提示生成图像。
🏷 labelling Labelling steps 用于标记数据。