OpenAI研究人員曾發(fā)文稱(chēng)「約 80% 美國(guó)人的中國(guó)最容最難P職工作將被 AI 影響」。
文章的易和業(yè)結(jié)論是,至少80%的所代美國(guó)勞動(dòng)力會(huì)受到影響,他們的中國(guó)最容最難P職工作的10%會(huì)被GPT所替代。其中甚至有19%的易和業(yè)美國(guó)勞動(dòng)力的50%工作會(huì)被替代。
但需要注意的所代是,OpenAI的中國(guó)最容最難P職研究是對(duì)于美國(guó)職業(yè)來(lái)說(shuō)的,中國(guó)的易和業(yè)勞動(dòng)力市場(chǎng)和美國(guó)有不少差異。
那中國(guó)的所代勞動(dòng)力市場(chǎng),有哪些職業(yè)的中國(guó)最容最難P職替代率最高,哪些職業(yè)的易和業(yè)替代率最低呢?
今天看到了一篇詳細(xì)的,用數(shù)據(jù)分析的所代結(jié)論,分享給大家!中國(guó)最容最難P職
因此最近兩周,易和業(yè)我們使用中國(guó)在過(guò)去8年的所代數(shù)億條招聘數(shù)據(jù)完成了這個(gè)研究,看中國(guó)哪些職業(yè)最有可能被GPT之類(lèi)的大語(yǔ)言模型和其衍生品替代。
分析不同職業(yè)被GPT替代的可能性,需要對(duì)每種職業(yè)的職能和具體工作進(jìn)行分拆。
比如你籠統(tǒng)地問(wèn),“人力資源專(zhuān)員”這個(gè)職業(yè),被GPT替代的可能性有多大呀?
這類(lèi)問(wèn)題就不好回答,因?yàn)樘:恕?/p>
但是你可以根據(jù)招聘網(wǎng)站的情況,將“人力資源專(zhuān)員”給分拆成不同的職能,比如:
1、新員工的招聘,員工入職手續(xù)辦理
2、安排以及開(kāi)展新員工入職培訓(xùn)
3、考勤及工資績(jī)效的核算
4、維護(hù)和拓展公司招聘渠道,協(xié)助社招及其他招聘活動(dòng)
去問(wèn)其中一個(gè)職能,例如“安排以及開(kāi)展新員工入職培訓(xùn)”,人力資源專(zhuān)員工作的這一部分有多大可能被GPT替代,就直觀了一些。
我們還可以繼續(xù)分拆,把“安排以及開(kāi)展新員工入職培訓(xùn)”,進(jìn)一步分拆成下列具體工作內(nèi)容——1,撰寫(xiě)、準(zhǔn)備培訓(xùn)材料;2,交流、溝通并安排計(jì)劃時(shí)間表;3,演講、培訓(xùn),提升員工技能……
再問(wèn)其中每一個(gè)具體工作,
撰寫(xiě)準(zhǔn)備培訓(xùn)材料,GPT可以替代多少?
交流和溝通安排時(shí)間表,GPT可以替代多少?
演講培訓(xùn),GPT可以替代多少?
我們用O*net的數(shù)據(jù),將中國(guó)的職業(yè)映射到O*net,再分拆成19265條工作任務(wù)和23534種工作內(nèi)容。
這么分拆下來(lái),每一個(gè)職業(yè)拆分研究,再匯總,那么我們對(duì)每一個(gè)職業(yè)中有多少部分可以被GPT替代,就比較有把握了。
分析每一種具體的職能和工作內(nèi)容被GPT替代的可能性。
但是,要分析19265種工作任務(wù),23534種工作內(nèi)容其中的每一種被GPT替代的可能性有多大,也是一個(gè)非常繁重的工作。一般來(lái)說(shuō)我們會(huì)讓人工來(lái)打標(biāo),這么四萬(wàn)條內(nèi)容全部打標(biāo),大概一個(gè)人就需要1周,一個(gè)人力的成本就要至少1萬(wàn)元。這已經(jīng)是最低的價(jià)格了。
但我們知道,在對(duì)美國(guó)研究的工作論文中,OpenAI的工作論文提出了一種重要的方法。那就是讓GPT來(lái)打標(biāo)。
那我們何不也用GPT來(lái)打標(biāo)呢?
于是我們用了GPT的API,讓GPT扮演打分者,大概是這樣的prompt:
你是一名“大型語(yǔ)言模型替代勞動(dòng)力評(píng)估師”。大型語(yǔ)言模型,是一種用于處理和生成自然語(yǔ)言文本的深度學(xué)習(xí)模型,最新的大型語(yǔ)言模型能夠基于自然語(yǔ)言文本生成、描述創(chuàng)建圖像與視頻。在這樣的背景下,你需要從“該任務(wù)是否能夠在大語(yǔ)言模型幫助下,在同樣時(shí)間達(dá)成同樣產(chǎn)出或者同樣效果的前提下,減少人類(lèi)勞動(dòng)時(shí)間的參與”的角度,給下列每一個(gè)任務(wù)打分。評(píng)分從0到5分,0代表該任務(wù)不能通過(guò)大語(yǔ)言模型的幫助減少人類(lèi)勞動(dòng)投入,1代表可以減少20%人類(lèi)勞動(dòng)投入,2代表可以減少40%的人類(lèi)勞動(dòng)投入,3代表可以減少60%的人類(lèi)勞動(dòng)投入,4代表可以減少80%的人類(lèi)勞動(dòng)投入,5代表可以減少100%的人類(lèi)勞動(dòng)投入,即該任務(wù)不再需要人類(lèi)勞動(dòng)參與。你的評(píng)分,代表著大語(yǔ)言模型可以在每一個(gè)任務(wù)中節(jié)省多少比例的勞動(dòng)投入,請(qǐng)根據(jù)當(dāng)前大語(yǔ)言模型的進(jìn)步情況和你認(rèn)為未來(lái)可能的發(fā)展?fàn)顩r,謹(jǐn)慎評(píng)分。請(qǐng)按照“id,評(píng)分”的格式,每一行返回一條任務(wù)的評(píng)分結(jié)果。
這段算是API里面system部分輸入的內(nèi)容,然后在內(nèi)容部分輸入具體的工作任務(wù)和工作內(nèi)容,GPT就會(huì)刷刷返回了,一次可以輸入100條,gpt-3.5-turbo的返回很快,一屏幕一屏幕的0-5的分?jǐn)?shù)就這么回來(lái)了。
說(shuō)實(shí)話,在看到這一屏屏的分?jǐn)?shù)出來(lái),知道這是GPT在為自己能多大程度上替代人類(lèi)勞動(dòng)打分,有種審判日到了的感覺(jué)。
由于任務(wù)已經(jīng)被拆解得比較細(xì)致,對(duì)于每一條任務(wù)的打標(biāo)將會(huì)十分準(zhǔn)確,穩(wěn)健性也極高。更重要的是,使用GPT打標(biāo),成本之低令人發(fā)指。標(biāo)注4萬(wàn)條內(nèi)容,每次標(biāo)注100條,只需要400次,一次標(biāo)注和返回大約在4000token左右,且主要內(nèi)容是在prompt中,使用GPT-4的模型,每標(biāo)注100條,僅需要0.12美元。也就是說(shuō),共標(biāo)注4萬(wàn)條內(nèi)容,只需要耗費(fèi)48美元。如果使用不那么精確,但速度更快且更便宜的gpt-3.5-tubo模型,4萬(wàn)條只需要耗費(fèi)3美元。在這樣簡(jiǎn)單的任務(wù)上,GPT-4和gpt-3.5-turbo的表現(xiàn)幾乎沒(méi)有差異。
人類(lèi)數(shù)據(jù)標(biāo)注員要完成4萬(wàn)條內(nèi)容的標(biāo)注,需要至少1萬(wàn)元,一星期。
GPT只需要半小時(shí),3美元,合20元人民幣左右。
而兩者的質(zhì)量是幾乎一樣的。
因此,很難不再次強(qiáng)調(diào)一遍這樣的事實(shí)——
剛剛出現(xiàn)沒(méi)幾年的全新職業(yè)——人類(lèi)標(biāo)注員,他們喂養(yǎng)出來(lái)的大型語(yǔ)言模型GPT,在完成一項(xiàng)“GPT能夠替代哪些職業(yè)”的標(biāo)注工作任務(wù)時(shí),首先替代掉了把GPT訓(xùn)練成材的人類(lèi)數(shù)據(jù)標(biāo)注員自己。
將標(biāo)注結(jié)果匯總到職業(yè)層面
使用下圖的流程,我們將每一個(gè)具體工作被GPT替代的可能性匯總到每一個(gè)職業(yè)上。
就能得到中國(guó)所有職業(yè)被GPT替代的可能性了。下表是招聘規(guī)模比較大的職業(yè)被GPT替代可能性的前25名和后25名:
上表的這50個(gè)職業(yè),可以理解為未來(lái)職業(yè)發(fā)展的晴雨表。
AI替代率最高的職業(yè)是翻譯,其次是保險(xiǎn)核保專(zhuān)業(yè)人員以及劇作家。這三個(gè)職業(yè),有90%以上的工作任務(wù)和內(nèi)容都暴露在AI替代的風(fēng)險(xiǎn)中。
接下來(lái),視覺(jué)傳達(dá)設(shè)計(jì)人員、裝飾美工、美術(shù)編輯、廣告設(shè)計(jì)師、剪輯師,這些與美術(shù)、視頻、作圖相關(guān)的職業(yè),被AI替代的工作內(nèi)容也超過(guò)了80%。
文字編輯、網(wǎng)絡(luò)編輯、文學(xué)作家、文字記者,這些與文字生成和修改高度相關(guān)的職業(yè),被替代的工作內(nèi)容也超過(guò)了75%。
呼叫中心服務(wù)員、前廳服務(wù)員(即為賓客提供咨詢、迎送、入住登記、結(jié)賬等前廳服務(wù)的人員)、節(jié)目主持人、秘書(shū)……這些職業(yè),也出現(xiàn)在了前25名中。
不過(guò)最出乎意料的可能還是排名第25的計(jì)算機(jī)程序設(shè)計(jì)員,平均來(lái)說(shuō),程序員有75%的工作內(nèi)容,面臨被AI替代的風(fēng)險(xiǎn)。
AI替代率最低的職業(yè)主要是各種制造業(yè)相關(guān)藍(lán)領(lǐng)人員。這并不意外,因?yàn)槲覀冏孏PT評(píng)分標(biāo)注時(shí)扮演的角色就是“大型語(yǔ)言模型替代勞動(dòng)力評(píng)估師”,它自然無(wú)法評(píng)估可能被其他機(jī)器所替代的職業(yè)。但仍然有幾個(gè)制造業(yè)工人以外的人員值得注意——綠化工、保潔員、洗衣師、按摩師、美甲師、中式面點(diǎn)師……看起來(lái)并不需要太高學(xué)歷,工資也不算最高的這些職業(yè),反而成了最難被AI替代的職業(yè)。
容易被替代的職業(yè)都有什么樣的特征?
在OpenAI的那篇工作論文中,研究者發(fā)現(xiàn)了穩(wěn)定的正相關(guān)關(guān)系——工資越高的職業(yè),被GPT們替代的可能性越高。這個(gè)趨勢(shì)在年收入大于10萬(wàn)美元的職業(yè)之后才區(qū)域相反,見(jiàn)下圖。
但在我們的研究中,在中國(guó),每個(gè)職業(yè)能夠被GPT替代的程度和該職業(yè)的收入?yún)s并沒(méi)有相關(guān)性,見(jiàn)下圖:
但是,每個(gè)職業(yè)除了工資以外,還有一個(gè)重要的參數(shù)——成長(zhǎng)性。
“成長(zhǎng)性”是我們另外計(jì)算的一個(gè)數(shù)據(jù),是使用分經(jīng)驗(yàn)?zāi)甓鹊恼衅笉徫粩?shù)據(jù),計(jì)算跨年度的經(jīng)驗(yàn)-工資差異得出的。
舉個(gè)例子,A崗位,在2018年時(shí),市場(chǎng)上對(duì)0年經(jīng)驗(yàn)需求的招聘崗位平均工資為5000元。2019年時(shí),市場(chǎng)上對(duì)1年經(jīng)驗(yàn)需求的A崗位招聘平均工資為6000元。
不難發(fā)現(xiàn),2018年0年經(jīng)驗(yàn)的這批人,和2019年時(shí)有1年經(jīng)驗(yàn)的這批人來(lái)自同一個(gè)隊(duì)列。因此,6000÷5000=120%,就是同一個(gè)隊(duì)列的人口,從2018到2019年,0到1年經(jīng)驗(yàn)帶來(lái)的工資增長(zhǎng)倍數(shù)。
我們算出所有年份,包括2015到2016、2016到2017……2020到2021、2021到2022這樣7個(gè)0到1年的經(jīng)驗(yàn)帶來(lái)的工資增長(zhǎng)倍數(shù),再按照招聘人數(shù)加權(quán)求平均,就得到了A崗位在過(guò)去8年時(shí)的0到1年經(jīng)驗(yàn)帶來(lái)的工資增長(zhǎng)倍數(shù)。
用同樣的方法,我們?cè)僖淮嗡愠?到2年的工資增長(zhǎng)倍數(shù)、2到3年的工資增長(zhǎng)倍數(shù)……8到9年的工資增長(zhǎng)倍數(shù)。將每一年的工資增長(zhǎng)倍數(shù)連乘,就得到了這個(gè)崗位從0年經(jīng)驗(yàn)到9年經(jīng)驗(yàn)一共10年工作的工資增長(zhǎng)倍數(shù),將這個(gè)倍數(shù)再開(kāi)九次方,就得到了這個(gè)職業(yè)的“成長(zhǎng)性”,即每增加一年工作年限,工資可能上升多少。
那么,從業(yè)年限的工資增長(zhǎng)率,即這個(gè)工作的“成長(zhǎng)性”,和每個(gè)職業(yè)的AI替代率之間存在什么關(guān)系?
可以看到,各職業(yè)的AI替代率,和每個(gè)職業(yè)的年限工資增長(zhǎng)率有著非常顯著的關(guān)系,兩者之間存在正相關(guān)的顯著性水平在0.001以下。如果我們將上圖改為分段柱狀圖,我們將可以看到更明顯的趨勢(shì)。
從上圖可以看到,每增加一年從業(yè)年限工資增長(zhǎng)最慢,低于8%的職業(yè),相對(duì)最不容易被AI替代的。但如果一個(gè)職業(yè)每工作一年工資增長(zhǎng)超過(guò)20%,被AI替代的可能性平均將大于60%。
這個(gè)趨勢(shì),說(shuō)明的是在本輪大語(yǔ)言模型和其衍生出來(lái)的相關(guān)AI的一個(gè)顯著特征,那就是人們?cè)谝粋€(gè)行業(yè)上積累的經(jīng)驗(yàn)、學(xué)到的技巧、掌握的訣竅,是被大語(yǔ)言模型首先替代掉的東西。
被GPT們替代掉的,究竟是什么?
“成長(zhǎng)性”越高的工作,越容易被替代,這說(shuō)明什么呢?
第一種可能,是因?yàn)槟切W(xué)習(xí)、工作后能積累更多經(jīng)驗(yàn),提高更快生產(chǎn)率的職業(yè),本身更貴,因此更促使人們?nèi)フ业侥芴娲@些職業(yè)的AI,給這樣的AI產(chǎn)品更大的投資,因此這樣更貴的勞動(dòng)力就成了第一批犧牲品。
這樣的說(shuō)法初看有道理,但我們也能找到很多反例。最大的反例就是自動(dòng)駕駛。一方面,駕駛這個(gè)技能,人們學(xué)習(xí)幾個(gè)小時(shí)至多十幾個(gè)小時(shí)就能掌握;另一方面,自動(dòng)駕駛領(lǐng)域投資在人工智能行業(yè)內(nèi)數(shù)一數(shù)二,但目前的效果距離全路況自動(dòng)駕駛依然有很長(zhǎng)一段距離。
反過(guò)來(lái),一些生物、化學(xué)方面的技能,化合物尋找、蛋白質(zhì)折疊,或者是在實(shí)驗(yàn)流程上的全自動(dòng)化,這些人們需要數(shù)年專(zhuān)業(yè)訓(xùn)練才能掌握的知識(shí),盡管資本的介入比起自動(dòng)駕駛只能算九牛一毛,卻已經(jīng)有了非常不錯(cuò)的替代AI。
從這點(diǎn)看,因?yàn)槟陈殬I(yè)勞動(dòng)更貴——為了節(jié)省這些勞動(dòng)力而更多投資AI——更容易造出替代這些職業(yè)的AI,這樣的邏輯似乎是行不通的。
因此,我們不得不考慮第二種可能——AI確實(shí)已經(jīng)實(shí)現(xiàn)甚至超越了人類(lèi)通過(guò)后天的實(shí)踐學(xué)習(xí)知識(shí)、積累經(jīng)驗(yàn)和訣竅的技能。
是的,有必要再?gòu)?qiáng)調(diào)一遍,不是單個(gè)技能,也不是一組技能,而是那種通過(guò)艱苦的學(xué)習(xí)實(shí)踐來(lái)獲取知識(shí)、積累經(jīng)驗(yàn)的技能,人類(lèi)已經(jīng)落后于AI。那些高成長(zhǎng)性的職業(yè),不管現(xiàn)在是否還處在安全區(qū),出現(xiàn)替代AI,也許就是這幾年,甚至幾個(gè)月之內(nèi)的事。
到頭來(lái),那些人類(lèi)孩提時(shí)期甚至出生時(shí)就已經(jīng)掌握的技能,那些精巧的人類(lèi)生物學(xué)本能,似乎反而是AI最難模仿和替代的部分。
而那些后天學(xué)習(xí)到的知識(shí),花上好長(zhǎng)時(shí)間學(xué)會(huì)算術(shù)、學(xué)會(huì)寫(xiě)作,學(xué)會(huì)畫(huà)畫(huà),學(xué)會(huì)編程、學(xué)會(huì)做好看的ppt、學(xué)會(huì)看X光片、學(xué)會(huì)寫(xiě)法律文書(shū),學(xué)會(huì)很多種語(yǔ)言并且自如地交流……人類(lèi)學(xué)會(huì)了各種各樣以此為傲的東西,并覺(jué)得這些特征似乎使人類(lèi)和其他生物產(chǎn)生了哲學(xué)上的差異。
但在AI看來(lái),這些東西一文不值。
審核編輯 :李倩