青青青久草,四虎永久在线精品,二区免费视频,一级毛片在线直接观看,黄网在线免费观看,美女露全身永久免费网站,色婷婷六月桃花综合影院

肯尼亞數據標注“血汗工廠” ChatGPT光環(huán)照耀不到的隱秘角落

《科創(chuàng)板日報》2月11日訊(編輯 邱思雨) 能聊天、代寫論文、作詩編程樣樣不在話下,ChatGPT發(fā)布不到一周便收獲了百萬用戶。其鋒芒從美國席卷到中國,但在地球另一邊的非洲大陸上,一群為OpenAI工作的外包數據標注員,曾遭受過非人的精神折磨。

坐在電腦前、閱讀一段文本、給出相應的標注、緊接著切換到下一段……這就是數據標注員的日常。在這場席卷中美兩個市場的資本狂歡中,他們是邊緣化的、被遺忘的卻又至關重要的一個群體。

據美國《時代周刊》報道顯示,為了訓練ChatGPT,OpenAI雇傭了時薪不到2美元的外包肯尼亞勞工,他們所負責的工作就是數據標注。

數據標注的工作流程包括數據標注、打標簽、分類、調整和處理等,是構建AI模型的數據準備和預處理工作中不可或缺的一環(huán)。對于ChatGPT這樣的語言模型,如果沒有人工標注來篩除一些不恰當的內容,那么它不僅會給出一些錯誤的信息,更會對用戶造成心理不適。

更何況,類似ChatGPT這樣的預訓練模型在訓練過程中需使用的數據樣本較多,數據標注的需求較高。

那么如何規(guī)避上述問題,篩查出有害內容呢?OpenAI效仿了Facebook等社交媒體公司的做法——構建一個額外的AI模型,向它提供暴力、仇恨等帶有攻擊性的言論,從而讓它學會識別相應內容。這樣的模型會被內置到ChatGPT中,幫助后者過濾掉一些有害的文本。

在這個過程中,需要大量的人力來給攻擊性言論做標注。于是,OpenAI在2021年底與一家外包公司Sama達成了合作。兩者簽署了三份總價值約20萬美元的合同,OpenAI向Sama發(fā)送了數萬個文本片段,包含大量的有關謀殺、自殘、虐待甚至其他更加不堪的內容。Sama公司的每一個數據標注員的日常工作流程就是閱讀文本并為其添加相應的標簽。

“那是酷刑”

Sama是一家主營數據訓練的公司,專注于為人工智能算法注釋數據,客戶包括沃爾瑪、谷歌、通用汽車和微軟等多個海外大廠。

Sama官網

據《紐約時報》早年報道和維基百科注釋,Sama標榜自己為一家有道德的公司:“Sama的使命是在數字經濟時代為低收入人群增加就業(yè)機會。”此外,公司聲稱已幫助超五萬人擺脫了貧困。

而Sama數據標注員的真實工作情況如何?據《時代周刊》披露,根據資歷和表現,Sama為OpenAI雇用的數據標注員的實際工資約為每小時1.32美元至2美元。有三位員工透露,在Sama,三十余名工人被分成三個小組,他們每九小時輪班閱讀和標記150至250段文字,每段文字大約100詞到1000詞不等。

上述被采訪員工均表示,這份工作給他們留下了“精神創(chuàng)傷”,雖然他們能夠參加公司組織的團體心理輔導,但輔導并沒有提供任何的幫助。此外,由于Sama對員工工作效率要求極高,所以公司很少組織心理輔導活動。有員工曾提出想與心理輔導員一對一進行咨詢,但被Sama的管理層拒絕。

其中一位數據標注員坦言,在閱讀了一些過于不堪的內容后,他反復出現幻覺。“那是酷刑。”他表示,“整個一周,你會反復的閱讀這樣的內容。等到周五,你會不停想象與它相關的場景?!?/p>

Sama的回應

低薪、高強度、創(chuàng)傷性的標注工作折磨著肯尼亞工人的身心。對于來自《時代周刊》等媒體的“控訴”,Sama回應外媒Quartz稱,其支付給標注員的薪資幾乎是東非其他內容審核公司的兩倍,并給員工提供福利和養(yǎng)老金,并聲稱這樣的待遇在東非并不常見。

據了解,肯尼亞并沒有統(tǒng)一的最低薪資規(guī)定。但在內羅畢(肯尼亞首都),一個接待員的最低時薪是1.52美元,而Sama的數據標注員最低薪資僅為1.32美元。在Sama與OpenAI的合同中,OpenAI向Sama支付每小時12.5美元的工作費用,是Sama數據標注員最低薪資的9倍以上。

Sama的發(fā)言人還表示,在每九小時的輪班工作里,標注員只需要標記70段文字,而不是上文所述的150至250段文字。此外,數據標注員的稅后時薪為1.46美元至3.74美元。合同中每小時12.5美元的工作費用覆蓋了包括基礎設施、質檢、管理團隊薪資等在內的所有成本。

針對員工遭受心理折磨的情況,Sama的發(fā)言人則聲稱,公司十分重視員工的心理健康?!拔覀?yōu)閱T工提供一對一的心理咨詢。在審核、標注工作過程中,員工可以隨時退出工作,且不會受到任何的懲罰?!痹摪l(fā)言人補充道,“員工標注有害內容的時間是有限的,敏感信息會有專人處理。”

違法、解約和失業(yè)

2022年2月,OpenAI與Sama加深了合作,OpenAI要求Sama收集數千張暴力和黃色的圖片,其中包括一些違法美國法律的內容。據《時代周刊》、《布魯塞爾時報》等外媒報道,當月,Sama給OpenAI交付了一批1400張圖像的樣本,后者向前者支付了787.5美元。

但很快,兩者的合作破裂。Sama在一份聲明中表示,有關圖像收集工作的原始合同并未包含違法內容,但工作開始后,OpenAI向其發(fā)送了一份附加說明,其中提及到一些涉嫌違法的內容。因此,Sama決定終止與OpenAI的合作。

在2022年2月下旬,陸陸續(xù)續(xù)有Sama的員工收到了轉崗和裁員的通知。一位員工無奈的表示:“對我們來說,這是一份養(yǎng)家糊口的工作。而現在,僅有30多名工人被迫轉到更低薪的崗位,其他人都面臨失業(yè)?!?/strong>

今年1月10日,Sama宣布取消所有涉及到敏感內容的工作,并表示不會與Facebook續(xù)簽價值390萬美元的內容審核合同。據了解,Facebook也曾被指控雇傭外包勞工來審核有害內容。

Sama表示,經團隊多次討論后,公司決定剝離自然語言處理和內容審核業(yè)務,專注于構建計算機視覺數據標注解決方案。