- 作者:dianwo
- 发表时间:2019-01-10 11:26
- 来源:点我科技
中国数据标注员正在被美国所重视
参考消息网11月27日报道美媒称,推进中国技术目标的一些最关键的工作,正在远离北京和深圳“硅谷”的中国内陆的一座前水泥厂里进行。
据美国《纽约时报》网站11月25日报道,在这里,侯夏蒙(音)经营着一家帮助人工智能(AI)了解世界的公司。24名年轻人正在检索照片和视频,对他们看到的一切进行标注。这是一辆汽车。这是一个交通信号灯。这是面包,这是牛奶,这是巧克力。这看上去像一个人在走路。
24岁的侯女士说:“我过去以为机器是天才。现在我知道了,是我们把它们变成天才的。”
报道称,在中国这个世界工厂,新一代廉价工人正在组装未来的基础。在一些不太富裕的小城市涌现的初创企业,正在为中国的海量图像作标注。一位专家指出,这些企业就犹如精炼厂,他们正在把原材料变成驱动中国的AI野心的燃料。
报道称,中国政府和企业拥有大量数据,中国的互联网企业可以获得比脸书、谷歌和亚马逊公司能得到的更多的数据,因为大量中国人使用智能手机购物、吃饭或者买电影票。
报道认为,标注这些数据的能力或许是中国真正的AI实力所在,也是美国唯一无法与中国抗衡的一点。在中国,这一新兴产业为中国政府一直在承诺的未来带来了希望:即以技术而不是制造业为基础的经济。
在中国河南省郏县的一个数据标注工厂,联合创始人伊亚科说:“我们是数字化世界的建筑工人。我们的工作是一层一层地垒砖。但我们在AI领域发挥着重要作用。没有我们,他们盖不起摩天大楼。”
AI引擎虽然学习速度极快,擅长处理复杂的计算,但它们的认知能力甚至不如一个普通的5岁小孩。小孩子们可以把福特皮卡和大众甲壳虫区分开来,他们还知道两者都是汽车。
但AI却必须有人来教。它们必须先消化大量带有标签的照片和视频,然后才能知道黑猫和白猫都是猫。这就是数据工厂及其工人的用武之地。
在标注员的帮助下,北京的AI企业——创新奇智公司为一家连锁面包店安装了自主结账系统。顾客可以将他们的糕点放在扫描仪下,无需人工帮助就可以付款。但在近三分之一的时间里,由于照明和人体活动等原因,该系统很难分辨甜甜圈或肉松面包。创新奇智目经理梁瑞(音)说,如果使用从商店内部拍摄的照片,标注员可以把准确率提高至99%。
创新奇智公司只有不到30名标注员,但标注初创企业的大量涌现,使这项工作变得容易起来。有一次,梁瑞需要在3天内对一家超市内的约2万张照片进行标注。在数据工厂的帮助下,他们只花了几千美元就完成了这项工作。
河南这家数据工厂的联合创始人伊亚科说:“我们就是10年前的组装线。”
这些数据工厂出现在远离大城市的地区,通常是劳动力和房租都很便宜的相对偏远地区。许多数据工厂的工人曾在大城市的组装线和建筑工地工作过。但工作越来越少,工资增长放缓,而且很多中国人更愿意生活在离家乡更近的地方。
36岁的伊亚科失业后,想与小学同学一起创业,在听说了AI标注后,他先去网上搜索了一番,他认为,这不是什么高难度技术,只是需要廉价劳动力,而这在河南有很多。
今年3月份,伊亚科和朋友成立了睿金网络科技有限公司。公司目前有300名员工,但他们计划在春节假期结束后将人员扩大至1000人,因为届时会有大量农民工返乡。