点击联系客服
客服QQ: 客服微信:

珠海老站长

查看: 773|回复: 50

数据显示公司:站在人工智能风口 为5K工资而挣扎吗?

[复制链接]

1

主题

1

帖子

-7

积分

限制会员

积分
-7
发表于 2021-9-30 11:56:26 | 显示全部楼层 |阅读模式
上个月,特斯拉首席执行官马斯克表示,为了做人们讨厌的危险、重复或枯燥的工作,明年将推出“Tesla  Bot”人形机器人原型。这个计划一公布就引起了广泛的讨论,外国媒体的焦点集中在安全上。在国内,隐藏在人工智能产业链中的一群“小人物”开始浮出水面,集中在舆论上。

他们是AI行业的能力者,是人工智能背后的“人工”。AI繁荣的背后是亿万级的数据信息,这些信息在水流工作中最终被传送到名为“治水者”的计算机上之前,手动转移到“智能”上。

他们用“老师”角色3354手传授现实世界的表情和动作后,等待着一个名叫AI的“学生”成长和离开。也许有一天这个“AI学生”会代替“老师”的位置。如今,随着数据标记产业的反复升级,这些数据注释者很快就可以离开舞台了。

入行、扎根

在上海的一个创造园区,主管刘梦妍(化名)坐在自己的隔间里,等着着手的标记师送来整容的文件。

外面的工地上坐满了职员,他们一个个把头靠近屏幕,把脖子往前伸。其中一名职员正在进行“描述标记”,并逐帧剪切和放大视频,仔细标注面部特征、骨头弯曲点。由于截断的屏幕像素低,大部分工作人员习惯性地滑动鼠标滚轮,叹气。





职员操作的“点标记”是面部识别前的重要步骤之一,不仅有“点标记”,还有分类尺寸、盒子尺寸等。AI不是生来就能识别人的眼睛和耳朵,而是要通过尺寸师画的脸部钥匙建立对五官轮廓的认识。在此基础上,AI可以通过这些点组成的轮廓特征执行一系列识别任务。

当你“擦脸”解锁手机并完成支付时,进入火车站用检票设备扫描脸部时,都在使用面部识别技术。(约翰肯尼迪,面部识别,面部识别,面部识别,面部识别,面部识别,面部识别)帮助这项技术的就是数据标记师。

在有刘梦妍的公司,标记公司用细腻起伏的鼠标点击声创造了数千个关键点。这项工作是“初级”,但也很难。刘梦妍偶尔从家里出来,奇怪地回到隔间。“我以前也是这样来的。很正常。”

她2018年入职,从机械输入(数据清洗)工作开始几个月后才正式进行数据标记工作。她的第一个任务是给年龄、性别、种族、头发、表情等形象中的人物贴标签。看了大量的人物标签后,AI就像提炼火眼金睛,“一眼就看出”人的特点。(另一方面)。

当时税后五千多的工资主要是门槛不高,但毕竟是网络民工的作用吧。当时,刘蒙烟台毕业后几次支援也不顺利,灰心的时候,她意外地与“标记师”见面,女人特有的细心和坚持到现在。

这就是刘梦妍入职的2018年,数据标记公司的风口到来。(威廉莎士比亚、温斯顿、数据、数据、数据、数据、数据、数据)据前瞻产业研究院统计,2017年与数据标记相关的融资事件有9起,到2021年4月为止,共有18家公司获得融资,投资融资事件有39起。





资料来源:展望产业研究所

随着这一潮流,很多数据服务公司也进入了日益扩大到乙方的市场,为百度、阿里等大型互联网公司和部分AI独角兽企业提供服务。





照片来源:人民社会事务部

2020年4月26日,人力资源和社会保障部正式宣布,“人工智能培训师”正式成为新职业,列入国家职业分类目录。预计到2022年,国内外相关从业人员将达到500万人。

虽然行业是向上的,但“老师”们仍然以密集而辛苦的劳动助理AI逐步成熟。明亮的AI技术发布会在舞台前风景无限,但显示公司的生活似乎变得有些困难。

刘梦妍望着现在的职员说:“没有技术含量,要求准确度,容易出错。”每幅画需要标记的地方都很繁杂,稍有偏差就会发生错误。一张图片错误,影响整个数据包数据,然后是“电路重组”。

除了准确度之外,疲劳是尺寸史上最大的敌人。做这件事很久以后,我清楚地知道客户会通过我们实现什么样的——。就是用人脑做电脑。“刘梦妍笑着说。

大企业利用软件监视标记公司的疲劳度也是一种人性表现。“但是很小。
公司本来就是接人家剩下来的活,时间紧任务急,只能拼着命熬,”正是如此,刘梦缘的团队里常年备着成箱的红牛和西洋参含片。

AI快速发展的背后,一批批“老师”换血,流动率相当高。“做文本标注的人员,现在越来越少,图像标注的30%的流动率,语音、视频常年都是对半开。而且现在的95后、00后愿意做的人少了,一般呆过三个月就不愿意继续干了”。

3年时间过去了,刘梦缘不断和老同事告别。但她从枯燥无味的工作中坚持了下来,她记不得自己标注了多少图,只觉得自己是踏上了人工智能的大潮。

对那些新晋的员工,刘梦缘也是如此描述,“我们是走在智能时代前面的一群人”。

巨头来了
行业的分水岭出现在2019年初:几大互联网巨头纷纷意识到数据的重要性,并着手建立自己的“数据工厂”。



据媒体报道,截至今年3月,百度山西人工智能数据产业基地中,就拥有超过3000位标注师,主要涉及自动驾驶、人脸识别等内容标注,其中86%的员工为90后;字节跳动在北京、天津、济南、武汉各地,也招募了4万名数据标注师;腾讯更是直接把平台放到了线上,让标注师变成了一种“全民兼职”,称为“众包”。

巨头的加入一方面是为了市场和成本,另一方面也是出于数据安全考虑,所以在内部搭建专门的标注团队显然是一个好选择。但是,“模型的训练和数据需求是周期性的,任务不持续,今天有活、明天没活,人员容易流失,管理成本很高”,刘梦缘能理解大厂摆出“众包”的原因,“我让手下的人去试过平台的兼职标注,单个标注几分钱,一个月的收入在2000元左右,比起让外包来做,省了一半还多。”

“大厂出手之后,市场最后拼的就是成本”,那段时间刘梦缘所在公司业绩下滑了40%,而且做出的标注数据质量也差很多。



图片来源:Boss直聘

据懂懂笔记了解,2018-2020年数据标注师行业平均薪资为5000-6000元,如果晋升为项目主管或者更高级别的项目总监后,月薪才能向5位数靠拢。而这一薪资标准到了2021年, 在一些求生的外包“小厂”内,不升反降。



图片来源:职友集

巨头涌入,薪资缩水的“大趋势”下,能窥探出标注师行业的“小趋势”:许多数据标注就像被人精心种下的水稻,还未到秋收季节稻穗就掉进了土里。

年初,刘梦缘单独接了一个“私单”,赚了2万元。

那是一个大厂“丢”出来的单子,做无人驾驶的数据标注工作,由于公司手头上的人员都扑在另一个项目上,她拉了之前的一些老同事和10个兼职学生,干了个“包工头”的活。

已经快1年没有亲自上阵标注文件的刘梦缘,只能硬着头皮和所有人一样移着鼠标,头顶、脖子、肘部、手腕、膝盖……都要一个个地标出来。整整一周,一群人完成了几万个点位的标注——他们看似在科技的潮头,干的却是苦力活。

本以为这单生意之后,可以继续接小单,可好景不长。“4月份开始,很多新团队出现,压价特别狠,原来是标注的报价按毛算,现在报价单上都出现几分钱了”。

数据标注行业有一套分工流程:巨头把任务交给中游的数据标注公司,再由中游包给下游的小公司、小作坊,有的小作坊还会进一步众包给“散户”:比如兼职学生。一单生意几经转手,就造成了行业众包中介层叠越来越严重,利润所剩无几。

“AI 肯定是未来的大趋势,但我们这些小公司很迷茫,听说很多公司都不干了。”刘梦缘本想着“私单”做得差不多了之后就出来单干,可这样的行业情况下,她能感受到的只有压力。

困境、挣扎
尽管目前的情况不乐观,刘梦缘依旧相信,数据标注行业最终会大浪淘沙,而他们,是走到最后的那一批。

从好的局面来看,下游市场陷入混战的同时,上游的 AI 市场从未停止过发展,AI正在成为人们进入这个社会的“入口”,这让刘梦缘和其他从业者们感到充满希望。



但行业也显露出严峻的一面,数据标注在迭代:大模型慢慢替代标注师,一些门槛更高、学科更细分的领域正露出头角。比如,医疗健康领域需要对病理切片等进行标注,以腰椎间盘突出的 CT 片为例,标注员必须准确识别并标注出间盘的轮廓。不过,很多医疗专家并没有时间和精力做数据标注,而这类工作又是普通的标注师无法胜任的,通常需要请医生或医学院的学生来做,结果就是成本居高不下,这些专业人员的成本是普通标注员的10倍。

像刘梦缘之前那样手把手教人工智能学习的方式,被称为“有监督”的机器学习。但当人工智能被逐渐成熟,它自身的识别能力与模型拟合准确度将不断提高,进入人机协作模式。直至人工智能会在模型的注准确度与效率上完全超过人类,此时它便要离开人工标注,进入无监督机器学习。

理论上说,每一个垂直场景随着技术发展,人工智能都有可能进入无监督学习状态。AI的核心在于预测,AI的下一个变革是无监督学习、常识学习。也就是说,“老师”们正在努力让 AI 不依赖人类训练,自己去观察世界是如何运转的,并学会预测,最终AI要甩掉“老师”。

但刘梦缘并没有很强的危机感:“我带领我们的人在做一件最有意义的事,在将每一个个体的智慧转化为 AI。我能保证,如果未来 AI 取代人类,他们也会是最后一批被取代的。”

为什么是最后一批?“因为总会有一个新的行业需要引入 AI ,需要我们(标注师)为他们来做数据准备。”



刘梦缘一直认为:“最大的一块市场是审核”。随着 AI 技术的发展,早年一些基本的标注工作正被逐渐被淘汰。以自动驾驶模型为例:以前靠人工来识别车、行人,如今则是由机器先标出来,然后人再去检查标注是否正确。

她考虑过自己的职业规划:“非常想进大厂,可是简历不够漂亮,门槛都迈不进去”。

互联网大厂对于数据的重视,最直接的反应就是薪资,尤其是管理岗,优厚的薪资福利让很多人都羡慕不已,刘梦缘也是其中一员。除此之外,她还考虑过自己单干去开个小公司,然后以被收购的方式进入大厂的管理体系。

“不过,那都是非常遥远的未来,还是抓紧现在吧。”如今,刘梦缘已经升级为公司主管,名片上的职位是数据总监。她也不再像刚入职时那样累了,“每天工作结束,累得不行,还要在内部对比谁今天完成的任务多。”

当然,角色的转换之后刘梦缘会思考更多,“或许下一个风口明年就来,又或者……”她也有些语塞。

在科技急速发展的年代,各类人工智能的应用如雨后春笋一般闪现,随之而来的是职场的多变。刘梦缘现在能依靠的,就是自己在“教学”生涯中的经验,至于那些新入行的标注师们,他们刚踏上了人工智能的列车,却已经驶向一个模糊的未来。

本文来自微信公众号 “懂懂笔记”(ID:dongdong_note),作者:潘弗尼,编辑:秦言,。
回复

使用道具 举报

0

主题

517

帖子

-207

积分

限制会员

积分
-207
发表于 2021-9-30 11:56:27 | 显示全部楼层
路过,学习下
回复

使用道具 举报

1

主题

535

帖子

-199

积分

限制会员

积分
-199
发表于 2021-9-30 12:17:07 | 显示全部楼层
前排支持下分享
回复

使用道具 举报

0

主题

514

帖子

-182

积分

限制会员

积分
-182
发表于 2021-9-30 12:38:29 | 显示全部楼层
写的真的很不错
回复

使用道具 举报

1

主题

518

帖子

-221

积分

限制会员

积分
-221
发表于 2021-9-30 13:00:20 | 显示全部楼层
路过,学习下
回复

使用道具 举报

1

主题

488

帖子

-179

积分

限制会员

积分
-179
发表于 2021-9-30 13:21:13 | 显示全部楼层
前排支持下
回复

使用道具 举报

0

主题

508

帖子

-195

积分

限制会员

积分
-195
发表于 2021-9-30 13:41:59 | 显示全部楼层
不错不错,很好哦
回复

使用道具 举报

0

主题

551

帖子

-201

积分

限制会员

积分
-201
发表于 2021-9-30 14:02:21 | 显示全部楼层
不错不错,很好哦
回复

使用道具 举报

0

主题

542

帖子

-207

积分

限制会员

积分
-207
发表于 2021-9-30 14:22:24 | 显示全部楼层
路过,支持一下啦
回复

使用道具 举报

1

主题

492

帖子

-207

积分

限制会员

积分
-207
发表于 2021-9-30 14:43:56 | 显示全部楼层
相当不错,感谢无私分享精神!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|无图版|手机版|小黑屋|珠海@IT精英团

GMT+8, 2022-8-14 20:44 , Processed in 0.164118 second(s), 24 queries .

Powered by Discuz! X3.4

© 2020 Comsenz Inc.

快速回复 返回顶部 返回列表