美国记者飞到中国实地探访河南AI村
- 作者:吴汇众
- 发表时间:2019-01-15 04:13
- 来源:国外网站
人工智能这个行业这几年非常火爆,但数据标注只是人工智能的一小部分,不知道从什么时候被媒体纷纷关注,并不断报道,人工智能行业确实非常火,明年会更火。
2018年11月我公司负责人收到一封来自美国的邮件,
大致内容为,一位印度的华裔记者,跟美国媒体公司工作。通过网络搜索:数据标注,看到我公司网站并联系,
说现在在调查数据标注的行业,它的发展和未来潜力, 也对它的员工的背景好奇。如果方便的话我希望跟你们先电话上聊一下。然后如果你们愿意的话可以实地去采访。
12月初,美国记者飞到北京,来到郑州我们见面聊了很长时间,对中国和美国的人工智能和数据标注相互的了解,同时还探讨了中国和美国文化的差异。
具体过程就不说了,以下是采访内容,采访结束,美国记者希望我给他介绍一个偏远的数据标注团队,好有一个鲜明的对比,为了让美国记者不虚此行,给介绍了一个小兄弟的标注公司。以下包含采访内容。
具体过程就不说了,以下是采访内容,采访结束,美国记者希望我给他介绍一个偏远的数据标注团队,好有一个鲜明的对比,为了让美国记者不虚此行,给介绍了一个小兄弟的标注公司。以下包含采访内容。
在中国小城市、乡镇,无数年轻人正成为“数据贴标人”,他们每天坐在电脑前8小时,点击几10张照片,概述背景、前景和特定物品。他们的工作为AI公司的算法提供和处理大量数据。随着技术的进步,那些“低技能”的工作者将会失业,但也创造了很多“低技能”的工作。
周俊凯(Junkai Zhou,音译)的办公室座落在东沙河的边沿,这是1条静谧的河,它把将位于中国中部河南省的31.8万人的小县城民权县新旧两个部份辨别开来。在这里,19岁的周俊凯和他26岁的堂兄今年夏天1起创办了他们的小型数据贴标工厂。
他们创办的“俊鹏科技公司”办公室在1个租用的传统庭院住宅里面,是典型的河南农村。这栋房子很大,有两三层高,不像中国大城市普遍存在的公寓楼。在房子后面,1名男子在1片土地上耙叶子,周俊凯说,这些土地是1片庄稼地。
周俊凯(右)和他的表哥
在房子里面,唯1温暖的房间是办公室,10几个年轻人坐在宽大的发光屏幕前。在11月的某1天,屏幕和荧光灯几近不能照亮房间,当地污染程度已阻挡了太阳,4周弥漫着浓雾。
“俊鹏科技公司”的员工
这些年轻人是“数据贴标人”,他们每天坐在电脑前8小时,点击几10张照片,概述背景、前景和特定物品,所有这些都是根据正在进行人工智能的客户规格而定。有些人可能会标记医疗扫描图片,有些人标注风景和树木的照片,还有些人标注无人驾驶车辆的道路图片。这些都是人工智能算法学习“看”的数据。
人工智能行业依赖于这类便宜的人工,由于算法和“机器学习”在很多情况下都是由真人训练。
人工智能需要大量数据来学习和辨别模式,不管是图片、音频还是文本,由于它们不同于人类解释媒体。要教授算法如何准确辨认苹果是1个苹果,它需要不计其数的苹果图片。另外,算法很容易上当受骗。在1项实验中,安全研究人员发现,通过扭曲校车图片,虽然人眼看不到这类变化,但人工智能系统再也没法辨认它是1辆校车。
资金流入中国的人工智能产业,很少有地方比河南更好。在几年前河南富士康工厂(生产苹果产品)和电子工厂而闻名,现在,河南的城镇现在具有办公室工作人员,他们正在进行艰苦乏味的输入工作,让计算机变得聪明。
咨询公司AIB的研究显示,去年,风险资本家向中国的人工智能创业公司投入了50亿美元,这使得该行业的资金首次超过美国。中国政府已将AI领域作为优先事项,并在去年夏天宣布1项雄心勃勃的政策:到2030年建设价值1500亿美元的AI产业。
在推动中国经济发展的制造工厂中,河南人民也发现自己具有不断增长的劳动密集型数据标签公司这类边沿产业,这些公司为算法提供和处理大量数据。除中国最大城市有几家大型企业外,这些数据标注公司主要散布在较小的城市、城镇和农村地区。
周俊凯是在平顶山西部的镇上看到1些类似数据工厂后,想到了自己开店。他的表兄弟们1起拿出家里多年的积蓄(45000美元),购买了几10台电脑并租用办公室。据他们所知,他们是民权县中唯1的做这个产业的人。
“你不能期望具有这么高工资的人来完成这项劳动密集型工作”
从贸易学院毕业后,周俊凯开始进入这1行,之前他1直在找工作,但却处处受限。
19岁的周俊凯来自河南民权县的1个村落里。 他说,从贸易学院毕业后,他的工作选择其实不多。
“如果你不知道将来做甚么,你可以去1个大城市,成为1名白领工作者,然后每天都要挤地铁挤公交,”他说,“至于其他(领域),如果你想出人头地,就需要大量的知识、经验和教育。而这些是我们没有的东西。“
他很难才找到了1份汽车修理工的工作。他说,在1家工厂干了很短时间就辞职了——那份工作太苦了,要1天工作14个小时。
“我以为我再也受不了(这些),”他说,但“现在从事的这个行业感觉它有潜力。”
韩金浩(Jinhao Han,音译)说,许多人现在正涌向数据标注行业。1年多前,他在河南省省会郑州开办了他的数据标注公司Dianwokeji(点我科技),目前具有了100多名数据贴标机。
“虽然标注是相当低级别的工作,但进入门坎相对较低,而且仍属于人工智能行业。”他说,“所以我们认为,如果我们可以从这里开始,然后渐渐地、1步1步地走向更高价值的东西。”
韩具有超过6000种数据标注设备,这些设备已在他建立的类似Craigslist的平台上注册,其中较小的设备可以找到外包或雇用新员工。
18岁的赵梦瑶(Zhao Mengyao,音译)是个新手。她于今年10月开始在周所在的公司工作。当我访问办公室时,她正在追踪停车场停车位的白线:画面扭曲,线条曲折,好像相机的1个鱼眼镜头,但她轻松地将鼠标放置在它们上面。20分钟后,赵梦瑶继续处理她下1张照片。这是停车场的另1个角度的照片。
年轻姑娘正在学习如何给汽车标注
在她旁边,1个年轻人则在描出1位歌手穿着的橙色连衣裙的疏松边沿。接下来,他开始描1个打高尔夫球的人的轮廓。
赵梦瑶曾是1个婚礼摄影工作室的化装师,但由于工作疲惫而辞职。有几天她必须在清晨4点起来准备客户拍摄,而晚上7点才能回家。
而现在的工作节奏她很满意:朝8晚6,中间休息1个半小时。在午休时间,她和她的同事还能聊聊天,聊聊共同玩的游戏。
她说:“我觉得这很不错,这里很自由。”
赵说工资还可以:每处理1套照片(大概20张)就可以取得大概20元的报酬。她每天可以完成4到8套,即80到160张照片。当我问她认为照片会去哪里、有何用处时,她回答不知道。
我交谈过的7位数据贴标者的月工资从2000元人民币到4000元人民币不等。这与中国工人的平都可安排收入或税后收入相当——2017年为2164元人民币。“郑州有这么多可以取得这类水平工资的工作。”25岁的点我科技员工王玉双(Yushuang Wang,音译)说。
点我科技大多数员工都只有20岁出头。
AI照片辨认教学的标准是使用ImageNet的图象,这是1个由斯坦福大学教授李飞飞和她的团队创建的超过1400万张图象的数据库。该数据库依赖于亚马逊的Mechanical Turk,后者将劳动密集型工作外包,例如照片标记的工作以几美分/1张的报酬交给互联网用户去做。
但是,随着世界各地的企业愈来愈多地转向从无人驾驶汽车到医疗诊断等行业的人工智能利用,ImageNet和Mechanical Turk被证明是不够用的。
你认为我们会让没有生命的东西控制人类吗?
数据标注公司Awakening Vector的开创人Peter Yang说:“医疗业务需要非常细致的数据来让人工智能学会如何做出区分,例如在CT扫描中区分肿瘤和眼球。”它需要在大量不同的照片中,通过数据来指出照片中的肿瘤是甚么模样,这就需要人工的来点击并标注图片。
“但大多数人工智能初创企业只有少数全职员工,通常都是数据科学家。”
“这需要大量的体力劳动。你不能期望收入这么高的人做这类劳动密集型的工作,所以你必须把这项工作外包出去。”
另外,还有隐私和质量控制问题。
例如,医学图象需要保密。亚马逊土耳其机器人(Amazon Mechanical Turk)的任务是由任何想赚外快的注册用户来完成的,而不是那些周1到周5都有固定工资的员工。
外包意味着这些业务现在在国内遍地开花。
Peter Yang的业务集中于新疆,客户包括百度和跨国制药公司诺华(Novartis)。韩金浩的公司为国内1些无人驾驶汽车初创公司服务,在河南和邻近的山东省的1些小城市也设有分支机构。
传统观点认为,随着技术的进步,那些“低技能”的工作者将会失业。学术研究大多也支持这1观点。
但这其实不意味着科技必定会取代所有的工作岗位。
波士顿大学科技与政策研究项目的履行主任James Bessen说:“历史研究表明,自动化带来了就业热潮。”
“以纺织业为例,在19世纪初期,由于布料太昂贵,大多数人只有1套衣服。但随着科技的发展,1些任务变得自动化,降落了制作衣服的本钱,人们对布料的需求也在增长。服装需求的增长带来了更多的就业机会。虽然纺织业被认为是“低技能”的行业,但随着范围的急剧扩大,它也带来了新1代的工人,他们不能不学习操作复杂的机械。只有当需求得到满足时,就业人数才开始降落。”
就目前而言,我国的劳动力还算是便宜的。
这项工作也超出了图片标注的范畴。许多公司还为语音辨认、视频标签乃至原始数据付费。
对1些工人来讲,成为1个新行业的1分子有1种明显的自豪感。
“我们正在做1些非常基础的工作,虽然只是帮助机器人学习和查看大量数据,但我们也是其中非常重要的1部份。”
那末如果有1天算法学会了自己辨认事物,那末数以万计的“低技能”人工智能人材会失业吗?
韩金浩仿佛对此漠不关心:“如果真的到了那个阶段,那末人类可能就不会活着了。你认为人类会让乃至没有生命的东西控制人类吗?我们只会教它如作甚人类服务。我们不会把他教得那末好以致于有1天我们要为机器服务。
愿您心想事成,感谢支持。
找数据标注供应商请认准,点我科技:www.dianwokeji.com