AI数据标注的作用是什么?
- 作者:dianwo
- 发表时间:2019-09-17 06:45
- 来源:未知
AI数据标注的作用是什么?
AI数据标注的作用主要为AI项目开发人的开发的算法模型标记用于培训机器学习模型的数据集合。
要训练机器学习模型,您就需要提供要分类或分析的内容类型的代表性样本,以及您希望模型处理每个样本的“正确答案”。例如,要训练一个对花朵图像进行分类的模型,您需要提供一个标有花朵类型(向日葵,雏菊,玫瑰,郁金香)的图像样本集合; 为了训练一个识别医疗文件中疾病名称的模型,您可以提供突出显示疾病的样本文件。 该模型学习从样本中推断出来。
通过对样本数据进行数据标注,您可以将代表性样本提交给使用“正确答案”对其进行注释的人类贴标机,并以适合培训机器学习模型的格式返回数据集。 您提供的样本数据类型和数据标注员添加的注释类型取决于您计划训练的机器学习模型的类型。
机器学习要请求数据标签,就需要为数据标注员来创建三个资源:
· 包含要标记的贴标机的代表性样本的数据集
· 注释规范集,用于标识贴标签的标签以应用于数据集中的项目
· 贴标人关于如何将标签应用于数据的一组说明
创建这些资源后,您将其作为标签请求的一部分提交。 数据标注员根据您的指示注释数据集中的项目,并返回一个带注释的数据集,您可以将其导出并用作自定义机器学习模型的训练数据