- 作者:网络
- 发表时间:2019-01-10 11:14
- 来源:国外网站
数据标注是新油,多年来已有人说过。如果数据是新的石油,那么中国已经是最大的生产国,其工厂挤满了劳动者,他们努力为机器学习注释图像和数据。机器学习需要大量数据才能表现良好,并且在过去十年中对高质量手工注释数据的需求飙升。“我曾经认为机器是天才。现在我知道我们才是他们天才的原因。“侯,这些工厂中的一位年轻的蓝领标签商人告诉国际日报。
所有行业的白领,即人工智能,都有一个新的工业蓝领劳动力需求激增。比老一代更精通技术的年轻工人为从事人工智能工作的公司找到了新的手工贴标数据。这些年轻员工通常在较小的城市工作,这些城市拥有多家创业公司,其唯一目的是为大型机器学习公司提供高质量的数据。
Rushkoff,这本名为“ 在Google巴士上投掷石块 ”的书的作者说:“找工作更难,或者每个人用更少的钱工作更多时间。技术似乎让我们处于这样一个永远存在的状态,在这个状态下,我们的劳动力和数据以及我们的时间都从我们身上被提取出来。“在这样一个时代,似乎数据标签已经成为可以留住年轻人的蓝领工作远离人工智能抢救他们的工作。似乎年轻一代可能能够养活AI野兽而不是被它们吃掉。
需求激增便宜的人力劳动
一个典型的例子是位于北京的创业公司Mada Code,其员工自由职业人数为10,000人。这些自由职业者为各种任务注释数据,如光学字符识别(OCR)和自然语言处理。该公司将微软,卡内基梅隆大学和其他全球公司视为客户。
可以在线形式的数据标签工作,人们可以通过移动应用程序注释图片。而在另一种形式中,工厂里摆满了数据贴标人,他们坐在电脑前,轮流做手工注释。AI应该是人类可以真正自由的梦想,许多工作都可以实现自动化。但在我们到达那里之前,世界需要一大堆人类注释,这可能是非常苛刻的,也是单调的。纵观人工智能的愿景及其对我们未来的参与,中国数据标签行业不仅仅是具有讽刺意味。
以最低工资为硅谷服务
没有手工标签就没有机器学习,因此人工智能生态系统需要这样的行业。正如李元在最近为纽约时报撰写的一篇文章中引用中国数据标签公司的联合创始人所说:“ 我们是数字世界的建筑工人。我们的工作是铺一块又一块。但我们在人工智能中发挥着重要作用没有我们,他们无法建造摩天大楼。“
这些工厂的情况与硅谷的豪华办公室或北京和深圳的中国科技中心截然不同。劳动者的工资只有最低工资,再没有免费的食物供应像许多科技公司。再也没有像医疗保健甚至台球桌那样的其他福利。但是没有这些劳动者,人工智能的革命几乎是不可能的。
有一个积极的推动力,通过增长到劳动力成本低得多的地区进一步降低成本。有些任务比其他任务困难得多。就像人体注释要困难得多,每个数字需要15-40个点。标记数据的应用很棒。有从机器人到语言处理引擎的应用程序。
“10年前,没有iPhone或富士康员工。我想当一些工作被取代时,总会有一些新工作。“Mada Code的项目经理张说。