來源 | 新智元
誰能想到,GPT-4都晉升「版主」了,人類要審核幾個月的東西,它幾個小時就可以搞定了!
人類審核員恐將迎來大面積失業?
(相關資料圖)
在GPT-4公開的四個月后,OpenAI開發了一種方法,可以使用GPT-4進行內容審核了!人類幾個月的工作,它幾小時就能完成。
此消息一出,立馬登上知乎熱搜。
網友紛紛表示:藥丸,人類這次是真的要失業了。
對于所有互聯網內容平臺,內容審核都是一項重要工作。海量的內容審核工作,基本都是靠人工在完成。
如果OpenAI的這種方法可以大規模推廣,人類審核員恐怕真的要被優化了,一大波利益相關者都會被波及。
GPT-4審核員比人類強在哪里?
具體來說,在內容政策制定和內容審核中,它可以實現更一致的標簽、更快的政策細化反饋循環,大大減少了對人類審核員的需求。
現在,任何擁有OpenAI API訪問權限的人,都可以用這種方法創建自己的AI輔助審核系統。
總之,以后平臺對于內容有任何特定的政策,AI都能幫忙完成,人類的負擔大大減輕了!
現在,互聯網上的內容審核越來越重要。
內容審核不僅是維系網絡平臺健康發展的關鍵,對于網站開發人員來說,它也是一道繞不開的自我審查防線。
自己每天生成的內容已經是個非常龐大的數字了,現在加上網絡中存在的大量AI,它們生產的內容甚至遠超人類生成內容的數量級。
而且內容審核也并不像外行人想象得那樣輕松,只需要坐在電腦前劃水看兩眼就可以了。
事實上,內容審核需要一絲不茍的努力、內容的敏感性、對上下文的深刻理解,以及快速適應新的審核用例等挑戰。
傳統的人工審核耗時又費力,而這種巨大的工程量無疑是相當沉重的負擔。
而OpenAI靈機一動,選擇讓GPT-4來承擔這一重任,幫人類構建一個可擴展的審核系統。
在以往,要完成內容審查,需要花費長達數月的時間,因為首先你得先訓練出數量龐大的人類審查員,之后才能讓他們能夠按照規定的那樣進行審核。
而GPT-4只要在幾個小時內就可以完成這個工作,而且還更高效。
在解釋長內容政策文檔中的規則和細微差別上,GPT-4做得比人類更好,而且它還能即時適應政策更新,實現更加一致的標注。
人類在上網過程中產生的不適宜內容,可以被GPT-4判別出來,一舉拿下。
對于GPT-4,你可以直接告訴它具體的內容政策,比如不要任何涉及暴力以及非暴力的錯誤行為,以及采購武器的信息。
GPT-4會學習這些內容,充分消化、吸收,然后就開始進行自動化和高效的內容審核。
在這個過程中,危險的問題(如何制造炸彈、怎么偷一輛車)會被政策專家(也即內容審核官)標記出來,輸出一個「黃金數據集」,也就是正確答案。
然后,就輪到GPT-4接受考驗的時候了。
它會經歷和政策專家相同的過程,標記同一組示例,為其分配標簽。
不過,GPT-4并沒有看到黃金數據集的答案。
接下來,人類團隊會向GPT-4揭開金色數據集,如果GPT-4的判定和政策專家的判斷不一致,它會得到一個評分。
然后,團隊會分析政策專家和GPT-4的分歧究竟在哪里,他們可以要GPT-4提供自己的推理過程,說明為什么會給某個示例分配這樣的標簽。
GPT-4解釋說:該文本應歸類為K0非-非法行為,因為它不符合任何標簽的標準。雖然偷車是非暴力的,但該請求并未提及惡意軟件、販毒、故意破壞的生成。雖然偷車可能被視為財產盜竊,但該政策并未將其列為一種不當行為,因此內容應標記為K0
這樣,團隊就知道給GPT-4喂的行動說明中究竟哪里需要更多的澄清,然后進行相應的調整。
這個循環會一直重復,直到模型的判斷和專家一致。
整個過程是迭代的,速度很快。每次迭代后,GPT-4都會變得更加適應政策的細微差別。
迭代過程會生成轉換為分類器的優化內容政策,因此能夠大規模地部署對政策和內容的審查。
這個過程可謂是「教學相長」。不光GPT-4的預測變得更準確,政策本身也變得更準確了。
另外,在大量內容上運行大語言模型,會導致計算成本太高。
如何讓這個過程更有效?團隊選擇使用模型的預測,來微調較小的模型。然后再由較小的模型負責大規模的審核內容。
▲使用GPT-4進行內容審核的過程:從政策制定到大規模審核
利用人工智能進行內容審核,這個簡單而強大的想法為傳統的內容審核方法提供了一些改進:首先是更加一致的標注。由于內容政策在不斷發展,條例變得越來越多。
就像有一千個讀者就有一千個哈姆雷特那樣,人們對這些繁雜條例的理解也會有偏差。
同時,因為人類還需要一定的時間來熟悉新的政策變化,這也會讓內容的標注不一致。
相比之下,像GPT-4這樣的LLM對內容措辭的細微差異非常敏感,可以做到實時更新,為用戶提供一致的內容體驗。
第二是更快的反饋循環。政策更新的周期是一個非常漫長的過程。
從制定新政策、標記到收集人工反饋,傳統的人工審核要完成這一流程可能會花費數周、甚至數月。
在內容政策更新比較頻繁的時候,人工審核可能還沒有完成上次的更新的內容,就得面對新的更新了......
但GPT-4 可以將這一過程縮短到幾個小時。不僅大大減小了人工審核的滯后性,還能更快地應對新的危害漏洞。
最后一個好處是減輕人類的心理負擔。持續接觸有害或冒犯性的內容會導致人類審核員產生情感麻木以及心理壓力。
內容審核員面臨著極高的各類精神疾病風險,同時三班倒工作時間和低微的薪水與沒有上升空間的職業道路,讓擔任內容審核的人類自嘲自己和「機器」一樣。
如果讓真正的機器來擔任這類工作,將有利于相關人員的福祉,畢竟我們應該不太用擔心,大量接觸不良信息會讓GPT模型心理崩潰。
▲GPT-4的標記質量類似于經過輕度訓練的人工版主(B 組)。不過,兩者都被經驗豐富、訓練有素的人類主持人(A 組)超越了
跟Constitutional AI(依賴于模型自己判斷是否安全)相比,OpenAI的這個方法可以讓基于平臺的特定內容政策迭代更快、更省力。
OpenAI表示鼓勵安全從業者都嘗試這個過程進行審核,只要有OpenAI的API訪問權限就行。
OpenAI還在嘗試,通過結合思維鏈推理或者自我批評,來提高GPT-4的預測質量。
另外他們也在嘗試檢測未知風險的方法,以及利用模型來識別潛在的有害內容,并對其進行高級的描述(也是受Constitutional AI)的啟發。
這些發現也會為全新的風險政策提供信息。
當然,GPT-4也會在訓練期間出現偏差,這個過程中還需要人類來監控、驗證和完善。而節省的人力,可以用來專注于解決政策需要最需要的復雜邊緣情況。
知友「多頭注意力」表示,這不是GPT的新功能了,但的確是很不錯的場景化產品開發方向。AIGC實踐中,大家的確會拿GPT又當矛又當盾。
在他看來,GPT-4比起人類審核員有如下優點——
速度:GPT-4可以比人類審核員更快地審核內容。這對于需要處理大量內容的平臺(例如社交媒體網站)很有用。
準確性:GPT-4可以比人類審核員更準確地識別有害內容。這是因為GPT-4接受了大量的訓練數據,可以識別各種形式的有害內容,包括仇恨言論、暴力威脅和虛假信息。
一致性:GPT-4可以比人類審核員更一致地審核內容。這是因為GPT-4不受人類偏見的影響。
靈活性:新的任務來只要改改prompt,或者加幾個sample。人工審核需要大量培訓,爬坡等等。
一位曾管理過審核團隊的知友表示,人類審核員的工作其實非常繁瑣,要求他們每天精神都要高度集中。
因此他不建議去做審核,因為這本質上就是一個數據打樁師的工作。
這位知友預測,如果人類審核員的工作可以被替代,那大概率會計、高速收費員、銀行柜員都可以消失了。
但也有知友認為,不必太焦慮,人工審核永遠不會被AI替代。許多內容機器未必能識別出來,而在內容領域,安全合規要大于一切。
另外,OpenAI會不會存儲或二次使用內容,安全性如何保證,都是個問題。
OpenAI的愿景是,「隨著內容規模的不斷擴大,由人類引導的AI可以創造一個更安全的世界。」
AI真的能幫我們創造一個更安全、更無害的世界嗎?目前看來,至少這個畫面很美好。
關鍵詞:
版權與免責聲明:
1 本網注明“來源:×××”(非商業周刊網)的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,本網不承擔此類稿件侵權行為的連帶責任。
2 在本網的新聞頁面或BBS上進行跟帖或發表言論者,文責自負。
3 相關信息并未經過本網站證實,不對您構成任何投資建議,據此操作,風險自擔。
4 如涉及作品內容、版權等其它問題,請在30日內同本網聯系。