数字富士康
2014年冬天,山东蓬莱积起了厚厚的雪。小雪每天都要不情愿地钻出被窝,趟着大雪走到一家汽车工厂去插线。在固定工位站好后,她根据形状将面前充满不同插口的集成器及一堆接口各异的汽车线路一一匹配好,完成后迅速将其交给下一个人,再重复刚才的动作,直到下班。小雪知道,自己站一整天的工作只是整个工厂里头很小的一部分。
相比那年冬天,她更喜欢现在的工作,数据标注工厂里,她有接近两百个同事,大家能坐在属于自己的工位上干活。在给用于智能驾驶采集的图片做标注时,小雪需要选取一个可以画出2D框的标注工具(即是可以根据不同物体拖动出不同形状的画框),把图片中所有的机动车、非机动车、行人、红绿灯等标注出来。
同在汽车工厂流水线上的工作相比,眼前的键盘鼠标显示器替代了嗡嗡作响的流水线,从早上8点到晚上5点,小雪除了拽动鼠标外什么都不用想,重复一个动作就行,变化的只有眼前不同的图片——但这对小雪来说,工作中的新鲜感已经足够。
有的人说数据标注工厂就像富士康一样。北京另一家数据标注公司玛达科技公司CEO任树亮则直言不讳,数据这一块往往给人印象就是一个劳动密集型产业。某自动驾驶创业公司数据标注负责人经常私底下开玩笑说,这就是个“血汗工厂”。
目前的数据标注工厂,多集中在河北、河南、山东、山西等地区,这同以富士康为代表的传统人力密集企业的选址偏好重合度极高——以更低廉的劳动力成本支撑起聚集在首都的人工智能底层数据需求。杜霖介绍说,由于高昂的成本绝不能让北京去做最终的生产,而是做所有新任务来时的磨合测试以及最终的质量控制。生产任务最终还是落到周边城市。
只有招募像毛毛一样的大学生做兼职标注时,众包工厂能开出一张图1毛钱“高价”。任树亮对这样的定价有些吃惊,“我们还有按厘算的呢。”在一堆不同图片中识别某人是否是同一个人,这样的工作只能按厘算,不过也有从几十块钱到上百块钱报价的复杂标注图。杜霖说,图片的差异比较大,以工时来计算可能更准确,现在甲方公司至少应该给到30块钱每小时才能保质保量完成。
小雪挺满意现在的待遇,“之前的工作太累又挣不到钱”。现在公司包吃包住,提供四人间寝室,一个月到手的工资有4000-5000块,还可以和男朋友一同上下班。最近一段时间,工期赶得很急,小雪已经连续两个周末到公司加班,从早到晚地盯着显示器让她倍感疲惫,但她不想停下,基础加计件的工资构成总是多劳多得。
和传统生产流水线不同的是,在杜霖的工厂里,工作流程被设置为可实时切换:每期作业都不同,每期作业里头的每个任务也不相同。在一个小时的工作间隔里,小雪会碰到两个相同的标注任务,当两次标注结果差别较大时,就证明她已经疲劳了,这是,系统就会切换一个完全不同的任务交给小学操作,以保持员工的“清醒”和“新鲜”,最终达成杜霖宣称的准确率。
算上合作的周边工厂,杜霖的公司已经有2000多人,他们正在同时进行着20多个不同项目的标注。在这样一个人力密集型行业里存活下来,并且保障交付的数据达到90%的精度,他坚信,管理才是关键。
管理,管理,以及管理
林霞是小雪的直接管理者,她是老板杜霖最信任的人,已经有18年类似的工作经验。当接到一个新项目时,她要确定整个项目流程。前段时间,林霞拿到了一个智能驾驶的标注项目,里头既有夜间拍摄的图片也有白天的图片,为了保证标注质量林霞就决定让能力强一点的员工做夜晚图片的标注,而能力弱一些的就标注白天拍摄的图片。这是第一步,分析客户给到的图像,如果是涉及到对人的标注,要分析给到的图片包里单人和多人的图片各占多少,明确需要标注的工作量大概多大。
分析完后,她会将具体的标注任务分配给手下的员工。可能一些人擅长标注道路场景,而另一部分人更擅长标注骨骼点,稍有难度的标注她会交给表现出色的员工,对他们进行重点培养。办公桌右侧的日历上每一天空白处都画着提示,如果标注进度比林霞想像中慢,她就必须留意其中的什么原因。标注完成后,最困难的地方就过去了,接下来就是质检、抽检及合成数据交付给甲方公司了。
“统筹安排”是整个生产过程的核心,所有工作的底线是要按照客户的要求按时完工。如果赶工期,林霞会要求手下员工加班,并且紧急调配人员。会出现一些让林霞头疼的员工,平时精度可能只能做到50%,做出来的全是“废品”。面对这种情况,林霞会坚持让他换岗,“不行就不能在我这岗位呆着。因为我的作业他干不了,既浪费我时间又浪费他时间,他还挣不到钱。”
林霞的这些经验为小雪给别人培训打下了基础。作为公司里比较优秀的员工,入职一年后小雪就作为培训老师之一去了河北徐水一居民小区里,这是她公司的一家合作工厂。这栋红色外墙的居民楼一层是数据标注工厂,楼上是老年人活动中心。进了大铁门后,有四个教室般大的工厂里面放着新的台式电脑。除了部分来兼职的学生们外,大部分都是些已婚中年人,有的骑自行车十分钟左右就可以到了,而有的就住在小区里。
第一次布置任务时,小雪不想给“学生们”的心理压力太大,她只布置了十张标注的作业。但学生们对于标注规则总有不同的理解,同样的东西她单独给一个人讲过三四遍。给他们练手的骨骼点标注图片里头,需要先标注骨骼点再连线,但有身体特别扭曲的图像,而规则里头明确要求左肩和左胯在同一水平面上。那些拿不定主意的学生,会像小学生面对着自己的老师一样,反复向小雪求助和确认。
不清楚标注规则既影响标注速度又影响标注质量。同样的一条眉毛,客户给的标准是将其划分成平眉和挑眉,但“平”和“挑”的定义,几乎人人不同。一轮标注下来,一塌糊涂。为了熟悉各个公司需求文档中不同的具体规则,每当遇到类似的新项目,林霞都会上手试标注。
两个星期后,这些偶尔会将左手标签贴在右手上的学生已经掌握了具体的标注规则,可以上岗了。小雪很享受被叫老师的时候,但还是更喜欢做数据标注,因为标注不费心,检查要承受被用户打回来返工的压力,压力更大。
对甲方公司来讲,谁来标注、如何管理这些都不是他们需要担心的问题,成本和按时保质交付才是核心。用智能程序覆盖城市低速场景的酷哇机器人公司目前主要跟杭州一些高校合作,学生是标注主体,采用这样的方式可以节省1/3的成本。曾对接过多次数据标注的工程师说,只要跟体量比较大的数据标注公司合作,一般精度和时间都可以有保障。
AI产业的源头和最不会被替代的人
每次回老家,当家人问起小雪的工作,她总是先说自己是“数据标注师”,再往下解释,说是做和计算机相关一些人脸、骨骼点标注工作。但没人听得懂,小雪在说什么,家里人就会在此停止追问,并暗暗觉得这是一个响亮的高科技职位。小雪从来没有想过自己的工作对于人工智能来说算什么,“只要挣钱就有意义”。
“负责静态物体检测/场景识别/OCR文字识别,负责人工智能与自动作业探索”这是百度招聘图像识别与人工智能算法工程师的工作职责描述,而“扎实的数学基础,掌握C/C++和Python语言,掌握OpenCV,掌握机器学习基本算法……”是对应聘者的要求。面对这些“同行业的同事”,中专文凭的小雪想不明白自己和他们的联系究竟为何。
但“小雪们”标注的上万张图片才是无人驾驶能够红灯停、绿灯行的基础。没有数据的清晰标注,深度学习的发展就是巧妇无米。另一家众包数据标注公司CEO任树亮认为,人工智能就是盲人摸象,有很多不同的部位,数据标注也是人工智能产业里面很重要的环节,不过容易被认为很low。
的确,同人工智能的响亮名号相比,数据标注几乎没有任何技术门槛。小雪初三时才第一次学打字,上中专后才“正式”接触电脑,而现在她已经被老板表扬为最出色的几个员工之一。踏实干好现在的工作是小雪从入职以来唯一的想法,这是姥姥的嘱咐,让她给弟弟妹妹做好榜样。其他人的情绪并不都像小雪一样稳定。有人领到分配的骨骼标注图片后,因为图像里头人太多就直接不做任务,但资源包被领取后就无法再放回资源池,如果不做,这包图片就不会有其他任何人能标注。而更不靠谱的人还会动摇其他员工。
2015年的初秋,吃饱了午饭的小雪坐上来数据标注工厂派来接他们入职的大巴车,同行的还有15名将一起毕业的同学,开往北京的路上,他们嘶吼的歌声盖过了车内的音响,整整一路,那份一无所知的兴奋感延续到了今天。每当听到人们谈论起人工智能会替代人力的时候,小雪都觉得不知所云。
“即时是被替代,数据标注师也将是最后一批被替代的人。”杜霖把观点灌输给了小雪和她的同事们,这让他们感受到了莫大的信心和骄傲。只有当真正把所有知识都教给老虎,猫才会被吃掉,在此之前老虎的猎物都只会是其他动物。作为人工智能的“老师”,他们还要不断教会人工智能新本事。
某创业公司对接数据标注的负责人认为,商业竞争才是决定这部分人不会取代的关键因素。每家公司都有自己的数据标注需求,并且他们暂时不会公开自己的模型,就像在互联网之初大家都不会开源自己的代码一样。可能到某个节点大家都公开自己的数据、模型后这部分人才会面对失业的担忧。
就算到了人工真正要被取代的那天,杜霖坚信她和他的工厂也不会慌张。这位“厂长”正盘算着把他拥有的人力资源复用到其他领域,比如承接一部分内容审核、信息核查的工作,“审核滴滴司机的驾照是否真实、微信是否是真的实名制、头条新闻是否是涉黄、涉恐”。
对于将来的发展,小雪还没想太多。她现在正在学习29点的人脸标注,每只眉毛上找到三个需要标注的点,眼睛上下眼皮各两个点、眼珠一个点外加两个眼角的两个点,共五个点,嘴巴有六个点……听完这些规则后,小雪惊喜地笑了,“一个人脸就出来了,老形象了,像‘弥勒佛’一样”。