google这一“大招”,要逼去世多少多AI标注公司?
手工小作坊 ,大招事实敌不外工场流水线 。逼去标注
假如说 ,世多少多当下的公司天生式AI,是大招一个正在结子妨碍的孩子 ,那末源源不断的逼去标注数据 ,便是世多少多其饲养其妨碍的食物。而数据标注 ,公司便是大招制作这一“食物”的历程。可是逼去标注,这一历程真的世多少多很卷,很累人。公司妨碍标注的大招“标注师”不光需要一再地识别出图像中的种种物体 、颜色、逼去标注形态等 ,世多少多无意分致使需要对于数据妨碍洗涤以及预处置。随着AI技术的不断后退,家养数据标注的规模性也日益展现。家养数据标注不光耗时耗力 ,而且品质无意难以保障 。为了处置这些下场,google最近提出了一种用大模子替换人类妨碍偏好标注的措施,称为AI反映强化学习(RLAIF) 。钻研服从表明 ,RLAIF可能在不依赖人类标注的情景下,发生与人类反映强化学习(RLHF)至关的改善下场 ,两者的胜率都是50%。同时 ,RLAIF以及RLHF都优于把守微调(SFT)的基线策略 。这些服从表明 ,RLAIF不需要依赖于家养标注,是RLHF的可行替换妄想。那末,假使这一技术未来真的推广 、普遍 ,泛滥还在靠家养“拉框”的数据标注企业,日后是否就真的要被逼上去世路了 ?数据标注现状假如要重大地总结当初国内标注行业的现状 ,那便是 :劳动量大 ,但功能却不过高,属于难题不讨好的形态。标注企业被称为AI规模的数据工场 ,个别会集在西北亚 、非洲或者是中国的河南、山西、山东等人力资源丰硕的地域 。为了操作老本,标注公司的老板们会在县城里租一块园地,摆上电脑,有定单了就在临近招人兼职来做,没票据就开幕劳动 。重大来说,这个工种有点相似马路边上的临时装修工。在工位上,零星会随机给“标注师”一组数据 ,艰深搜罗多少个下场以及多少个回覆。之后,“标注师”需要先标注出这个下场属于甚么规范,随后给这些回覆分说打分并排序。此前,人们在讨论国产大模子与GPT-4等先进大模子的差距时,总结出了国内数据品质不高的原因。但数据品质为甚么不高?一部份原因