欢迎光临KOTOO财情




中国 AI 另类经济,廉价人工涌向数据标签公司

2024-04-26 227

传统观点认为,采用更先进的技术,那些从事低技术工作的人将成为最大受害者,学术研究大多支持这一点,但这并不代表技术必然会取代所有工作,譬如 AI 需要大量数据来学习和辨别模式,要教授算法如何准确辨识苹果是一个苹果,它需要成千上万的苹果图片,而这些数据无论是照片、影片或声音档都需要有人做贴标签的工作,由此催生中国内陆城市诞生许多小型数据贴标公司。

据 VICE Media 旗下网站 Motherboard 报导,这些从事数据贴标的人每天坐在电脑前 8 小时,点击几十张照片,根据客户要求的规格,标示背景、前景和特定物品,有些人可能会标记医疗扫描档案,有些人标示风景和树木照片,有些人标示无人驾驶车辆的道路图片。这是让 AI 算法学习看数据的基础教材,AI 产业发展仍然需要仰赖这种廉价的人工,因为算法和机器学习在很多情况下都是由人来训练。

这是中国 AI 蓬勃发展的冰山一角。去年风险资本家向中国 AI 新创公司投入 50 亿美元,超过美国。中国政府已将该领域做为优先事项,并宣布到 2030 年将投入 1,500 亿美元。AI 也是中国制造 2025 中列出的十大重点产业之一。中国也是现在是世界上最有价值的 AI 公司商汤科技的所在地,商汤科技专注脸部和图像识别,并与全国各地的地方政府合作进行监控,据研究公司 CB Insights 称,商汤科技估值高达 45 亿美元。

而风光的 AI 公司幕后推手也包括上述这些劳动密集型数据标签企业,这些企业为算法提供和处理大量数据。许多中国年轻人正涌向数据标签产业,报导访问一家有 100 多名员工,设在河南郑州的数据标签公司老板表示,虽然标签工作是相当低级别的工作,但进入门槛相对较低,而且仍然是 AI 产业,“如果可以从这里开始,我们可以慢慢地,一步一步地走向更高价值的东西。”

数据贴标者的月工资从 2 千人民币到 4 千人民币不等,与中国工人的平均可支配收入或税后带回家收入相当,2017 年为 2,164 人民币。

现在 AI 照片辨识教学的标准是使用 ImageNet 的图像,这是一个由史丹佛大学教授李飞飞和她的团队创建的超过 1,400 万张图像的数据库,该数据库根据亚马逊的 Mechanical Turk,Mechanical Turk 将劳动密集型任务以一张图几美分价钱外包给网络用户。

随着 AI 应用愈来愈多,ImageNet 和 Mechanical Turk 证明是不够的,譬如辨识医疗图像需要非常详细的要点,才能帮助 AI 了解差异,由于一般 AI 公司只有少数几个数据科学家,需要大量的体力劳动,无法指望那些薪水如此高的人从事这项劳动密集型工作,所以这项工作必须外包。

标签工作也扩展到图片之外,声音识别、影音标签甚至原始数据都是一门生意,譬如河南的公司帮一家客户收集当地讲方言的儿童语音。但是任何一个低技术劳力工作最有可能被时代淘汰,当有一天算法学会自己识别事物时会发生什么事,这些数据标签公司的老板并不担心这个,还说“如果它真的处于那个阶段,那么也许人类将不再活着”。

  • China Is Achieving AI Dominance by Relying on Young Blue-Collar Workers

(首图来源:Flickr/Maxime Guilbot CC BY 2.0)

2019-03-11 06:31:00

标签:   资讯头条 kotoo科技资讯 kotoo科技 kotoo科技资讯头条 科技资讯头条 KOTOO商业产经 新闻网 科技新闻网 科技新闻 Kotoo科技新闻网 Kotoo 科技新闻 科技新闻网 新闻网 KOTOO商业产经 科技资讯头条 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条 Kotoo Kotoo科技新闻网 科技新闻网 新闻网 KOTOO商业产经 科技资讯头条 kotoo科技资讯头条 kotoo科技 kotoo科技资讯 资讯头条
0