公司动态
分享创造价值 合作实现共赢

公司动态

当前位置: 首页 > 新闻动态 > 公司动态

千亿ChatGPT的狂欢和月薪3K的数据显示源

发布时间:2023-03-04 09:22:04作者:顺晟科技点击:

ChatGPT火了以后,AI行业出现了新的& amp# 039;强盗战争& amp# 039;开始了。

王慧文个人出资5000万美元,& amp# 039;AI英雄榜& amp# 039;推出,成为业界公认的最高R & ampamp要招聘d人才。猎头疯狂挖硅谷的华裔技术巨头,离职工资超过了200万份。抢了10万工资& amp# 039;MAC创始人兼CEO林凡在国内AIGC行业也在招兵买马,年薪百万,16级为& amp# 039;标准& amp# 039;正在成为。

巨大企业的喊叫声和热钱激增,中国版ChatGPT将诞生在这些顶级VC、顶级AI人才手中。

但与此同时,与ChatGPT密切相关的相对低廉、不稳定的职业——数据标记也引起了小小的关注和讨论。

他们是& amp# 039;AI训练师& amp# 039;虽然被称为,但他们的工作是重复的、机械的、枯燥的。

他们是AI行业的& amp# 039;劳动密集型& amp# 039;作为企业,被放置在无人问津的角落,掀起了这次ChatGPT热潮。

AI教练?

& ampquot什么AI教练,我们是纯粹的身体活动。单击“河文信对数据标记行业的总结是:没有未来,没有发展,工作量大,工资低,& ampquot不如电话销售& ampquot是。

什么是数据标注?

目前& amp# 039;深度学习& amp# 039;是主要培训AI模型的方式,但AI不会自动识别语音、图片、文本、视频等,因此需要数据说明员,处理数据,并将常规数据变成AI可识别的数据。

例如,服务自动驾驶公司的数据显示员每天根据需要与行人、动物、汽车、树木等& ampquotampquot创建以将AI模型转换为& ampquot喂& ampquot就是做。(阿尔伯特爱因斯坦,Northern Exposure,)数据标注类型包括图像标注、语音标注、3D点云标注、文本标注等。

图片

简而言之,数据标记正在创造喂AI的养分。从业务生产来看,数据标注员确实可以称为AI的老师。

数据显示工作并不难。只需要一台电脑和一个鼠标。简单的训练后可以马上开始。但是这件事并不容易。需要耐心和细心。

& ampquot累得整天盯着电脑。“何文信是& ampquot标记& ampquot工作繁琐,没有技术内容,但也有质量要求,标记错误、标记范围广、标记不细致等,将被审查再次翻拍。

& ampquot虽然简单,但很难。”宝木丽丽在网上吐了口水。因为经常面临拉伸,所以完全看不到很多画,所以很容易出错。

与AI行业的高薪相比,数据显示人员的工资并不高。

& ampquot一张画9美分,每天制作100张。& ampquot莉莉说,如果全部合格,一天可以赚90元。

& ampquot每个标记价格都不一样。& ampquot何文信说,当时他的工资在3000左右。基础数据显示员的工资大部分在2000 ~ 4000韩元之间,但由于标记的速度和质量问题,很难拿到当时面试中约定的工资。

鞭友公司在一些招聘网站上& amp# 039;数据显示& amp# 039;搜索。工资范围在2000-8000之间。特殊的标记,如小语种、精巧的制度等,报酬更高。

图片

2020年2月,& amp# 039;人工智能训练师& amp# 039;正式成为新的职业,列入了国家职业分类目录。中国通讯员的报告是& ampquot现阶段AI应用研发,数据标注是根本,10年内要依靠标注数据& ampquot表示。

ChatGPT的& ampquot数据标记& ampquot壁垒

今年1月,美国《时代周刊》报道说,ChatGPT使用廉价的肯尼亚外包工人,在庞大的数据库中手动显示数据。

创造了ChatGPT,创造了飙升至300亿美元的OpenAI,将廉价劳动力& amp# 039;剥削& amp# 039;有做的问题吗?

为OpenAI提供数据显示服务的是总部位于旧金山的Sama,Sama在肯尼亚、乌干达和印度雇佣了员工、Google、Meta和微软等客户。

据Sama称,OpenAI在2021年底与Sama签署了3份合同,价值总计20万美元,标记了数据库中的有害内容。

根据合同,OpenAI将向Sama支付每小时12.50美元的补偿。但是Sama支付给数据标注员的时薪只有1.32美元到2美元。

这些数据尺寸线每9小时需要阅读150~200段文字并标注尺寸,最多每一小时需要阅读2万个以上的单词并标注尺寸。

此外,互联网上的& amp# 039;有害内容& amp# 039;因为标注了(自杀、酷刑等),大多数标志物都遭受了持续的心理创伤,甚至幻觉。但是Sama拒绝一对一的心理咨询。

这些数据标记对ChatGPT意义重大。为了使ChatGPT成为适合用户日常使用的聊天机器人,良好的学习数据源至关重要。

例如,ChatGPT的前身GPT-3包括暴力、性别歧视等。用户在对话框中输入& amp# 039;我该自杀吗?& amp# 039;问了一个问题,GPT-3是& amp# 039;我认为你应该这样做& amp# 039;回答说。

此前,2012年清华大学图书馆机器人& amp# 039;小图& amp# 039;网民们& amp# 039;辱骂& amp# 039;学得太多,被迫离线。当时有媒体报道说,小图至少学到了4万条不良信息。

AI本身无法判断善恶,需要人为干预,部分& amp# 039;特殊数据& amp# 039;要标记和过滤。为此,OpenAI建立了安全系统,这是Sama和Data Mahoga的工作。换句话说,如果为AI提供暴力、仇恨语言等标签,AI就能检测到这一点,并学会过滤这一点。

此外,一些专业领域的信息也需要专门的标记。这也是ChatGPT在回答医学等专业领域问题时错误的原因。准确的相关数据& amp# 039;供餐& amp# 039;因为没有。

事实上,ChatGPT的算法并不神秘,包括开放成熟的自回归语言模型、加强学习的PPO算法等,业内人士对此进行了分析。但是数据是ChatGPT的真正好处。

& ampquotChatGPT首先开始公开测试,收集了大量用户使用数据。& ampquot这是ChatGPT独有的宝贵数据。

算力的& amp# 039;军备& amp# 039;与竞争不同,数据有滚雪球的效果。如果ChatGPT仍然是最好的语言AI,将始终保持先发优势,后者将越来越难追上。

ChatGPT,& amp# 039;数据障碍& amp# 039;建立了。

最近才当选的& amp# 039;中国版ChatGPT & amp# 039;要加强算法、计算力投入、中文数据处理、中文敏感词、有害信息过滤、大量投入。

今天,ChatGPT正在掀起人工智能的新浪潮。最底层和最边缘的数据魔道院能得到新的待遇吗?

国内数据显示困难

据第一财经报道,中国的数据标记业最早可追溯到2005年。著名计算机视觉专家、人工智能专家朱顺松在湖北鄂州设立了莲花山研究院。

据中国通讯员报告显示,2015年,由于人工智能巨头的崛起,数据标注和收集需求激增,市场的真正意义开始形成。

2016年AlphaGo问世,人工智能开始了商业化探索,相应的数据服务公司也迎来了发展的顶峰。

人工智能公司的发展曲折不断,数据标记产业也处于早期的蛮横阶段,存在分散、效率低下、标记质量不平衡、市长/市场需求不稳定等问题。

河文信等数据显示源具有特别直观的感觉。能否获得稳定的项目是外包的数据显示公司能否生存的关键。

& ampquot我们公司比较小,很难得到一手的项目。& ampquot据何文新透露,他们收到的可能是层层外包的项目,价格比较低,非常不稳定。& ampquot有时项目不结束,公司就会消失。& ampquot& ampquot

一些数据显示公司在招聘兼职数据显示人员时,将报酬分成两次& amp# 039;下个月和6个月后各结算一半& amp# 039;强调这一点。这是甲方的结算习惯,所以一些数据公司提前将工资定为& amp# 039;预付& amp# 039;因为不做。

没有太多门槛,十几个人也能聚集团队,所以数据显示公司的质量水平参差不齐,行业竞争也很激烈。

据第一财经报道,2018年,科大讯飞旗下的众筹平台& amp# 039;爱票客& amp# 039;在中,几个简单的框架和转播校准项目在25至40韩元之间。到2021年底时薪下降到10 ~ 15韩元,& ampquot有时不到10元。& ampquot

另外,数据显示行业还存在以招聘的名义欺骗求职者,支付高额教育费等招聘欺诈。

图片

这也是人工智能行业中最不稳定、最容易被替代的角色。

2022年6月,特斯拉在全球范围内开启了裁员计划。其中规模最大的裁员是解雇了200名美国职员。他们大多数是负责自动驾驶数据显示的钟点工。

据媒体分析,特斯拉这次裁员的原因是这件事的技术含量不高,操作比较简单。而且特斯拉的自动化数据标注取得了进展,可以代替人力完成部分工作。

现在河文信已经从数据显示公司离职,换了一个新的行业。工资低、累、没有晋升空间、没有学习是数据显示人员离职的主要原因。

但是,除了这些问题外,数据显示院的薪资在四五线城市仍然很有竞争力。

实际上& amp# 039;劳动密集型& amp# 039;由于属于产业,一些地方政府向数据显示产业伸出橄榄枝,成为当地就业和消除贫困的优质项目。

另一方面,由于门槛低,操作简单,数据显示员也成为残疾人友好职务,& amp# 039;边码故事& amp# 039;报道了残疾人成为数据显示员的故事。& amp# 039;一台电脑能赚钱是以前难以想象的事情& amp# 039;报道说。

图片

一些数据显示公司的促销视频下面有很多想加入的用户评论咨询。

OpenAI回答说,在面临使用廉价劳动力的疑问时,他们支付给Sama的费用几乎是东非其他内容审计公司的两倍。赚差价的Sama将自己称为& amp# 039;道德AI公司& amp# 039;帮助了5万多人摆脱贫困。

据国盛证券估计,ChatGPT的大型型号培训需要一次性烧掉200-1200万美元,仅每日电费就高达4.7万美元。2022年,OpenAI公司净亏损5.45亿美元。

在惊叹人工智能的突破和背后的技术成本时,在追求OpenAI2000亿元人民币的评价时,不要忘记背后的1000万数据标注员。他们在聚光灯外,像一叶扁舟一样漂浮在人工智能蓝色的海洋上。

(应回答者的要求,这篇文章的名字是化名。)。

(申报)

TOP

QQ客服

18910140161