在机器学习中标注数据的技术方法有哪些?
- 作者:dianwo
- 发表时间:2019-09-17 08:36
- 来源:未知
数据标注是一种用一个或多个标签标记一组样品数据的技术。 数据标注通常采用一组未标记的数据,并将每条未标记的数据嵌入有信息的有意义的标记中。有几种方法可以为机器学习标记数据。
图像注释有助于使图像对计算机视觉具有可读性。 带注释的图像对于其他全自动算法结果的性能计算很有用。 它们被称为基准,基础事实或参考数据。
与带注释的图像相比,可以计算全自动算法的真实性和误报。机器学习中的注释是数据标注的过程,可以是文本,图像,音频等多种形式。
学习时,计算机可以使用带注释的数据来学习在呈现新数据时识别相似的模式。
常规使用的图像注释有许多标记技术,其中一些是
- 包围盒
- 多边形
- 关键点
- 立方形
- 语义分割
- 编修
包围盒
边界框是计算机视觉图像标注的重要方法。 在给定帧周围的对象周围绑定完美的框以进行一般识别。
多边形
以最佳精度生成框架中对象的边界,并提供有关对象形状和大小的明确定义。 这是对机器学习对象进行分类的最快,最智能和最协作的方式。
关键点
准确地标记图像中对象的所有必需部分,并有助于分析对象的位置和大小。 主要标记对象的最外点。
例如:对于车辆,我们分别标记最外面的点,如轮子,镜子和灯。
立方形
在所需的小工具,车辆,建筑物甚至人类周围塑造3D高质量标签,以获得物体的整体空间或体积。 主要用于建筑领域和物体识别领域
语义分割
在用于计算机视觉的图像注释中,语义分割是将数字图像划分成多个片段的过程,从而将图像的表示改变为更有意义且易于分析的事物。
编修
图像注释中的编辑用于模糊敏感和个人可识别信息。 编辑保护框架中看到的人,房屋和车牌的隐私和身份。