「人工智能想越獄「、」AI 產生自我意識」、「AI 終將殺死人類」、「矽基生命的進化」…….曾經只在在賽博朋克等科技幻想中出現的劇情,在今年走向現實,生成式自然語言模型正在遭受前所未有的質疑。
聚光燈下最矚目的那個是ChatGPT,3 月底到4 月初,OpenAI 開發的這個文本對話機器人,突然從「先進生產力」的代表變成了人類的威脅。
先是被上千位科技圈的精英們點名,放在「暫停訓練比GPT-4 更強大的AI 系統」的公開信中;緊接著,美國科技倫理組織又要求美國聯邦貿易委員會調查OpenAI,禁止發布商業版GPT-4;後來,意大利成為第一個禁用ChatGPT 的西方國家;德國監管機構跟進表示,正在考慮暫時禁用ChatGPT。
GPT-4 連帶著它的開發公司OpenAI 突然成了眾矢之的,呼籲AI 監管的各方聲音變得越來越響亮。4 月5 日,ChatGPT 以訪問量太大為由暫停了Plus 付費版,這是一個可以優先體驗GPT-4 模型的渠道。
如果算力與服務器是GPT-4 使用設限的原因,那麼這是技術瓶頸使然,但從OpenAI 的研發進展看,突破瓶頸的周期可能並不會太長,而人們也已經見識過AI 對生產力提升的效果。
可是,當AI 造假、洩露數據成為GPT-4 實操中的硬幣另一面時,AI 倫理、人類與AI 的邊界將成為全世界都無法繞過的問題,人類開始考慮將「野獸」關進籠子裡。
洩密、造假問題浮出水面
主權國家對ChatGPT 的禁令接踵而至。
3 月31 日,意大利個人數據保護局宣布,禁止使用聊天機器人ChatGPT,並表示已對該應用背後的公司OpenAI 展開調查,原因是ChatGPT 出現了用戶對話數據和付款服務支付信息丟失情況,缺乏大規模收集和存儲個人信息的法律依據。4 月3 日,德國聯邦數據保護專員稱,出於數據保護方面的考慮,正在考慮暫時禁用ChatGPT。此外,法國、愛爾蘭、西班牙等國的隱私監管機構都在跟進ChatGPT 的隱私安全問題。
ChatGPT 不僅在喪失各國「信任」。近期,韓國電子巨頭三星也因使用ChatGPT 出現了問題。據SBS 等韓媒報導,三星導入ChatGPT 不到20 天,便發生3 起數據洩露事件,涉及半導體設備測量資料、產品良率等內容。對此,三星啟動了「緊急措施」:將員工向ChatGPT 提問的限制在1024 字節以內。據悉,軟銀、日立、摩根大通等知名企業都曾發出了相關的限用通知。
應了「物極必反」那句老話,ChatGPT 為AI 產業注入「興奮劑」、引發科技巨頭AI 競速的同時,也帶來了無法避免的安全問題,最終遭到多點「封殺」。
數據安全僅是ChatGPT 潛在風險中的冰山一角,背後是AI 倫理對人類的挑戰:人工智能工具缺乏透明度,人類並不清楚AI 決策背後的邏輯;人工智能缺乏中立性,很容易出現不准確、帶有價值觀的結果;人工智能的數據收集可能會侵犯隱私。
「AI 倫理與安全」似乎過於宏觀,但當我們把視角聚焦於真實案例時,就會發現這個議題與我們每個人息息相關的事。
3 月21 日,新浪微博CEO 王高飛發博曬了一段ChatGPT 編造的假信息:「瑞士信貸被強制出售,有172 億美元的AT1 債務被直接清零」。網友「一玶海岸」對此指出,此前只有2017 年西班牙大眾銀行破產時出現過AT1 債券被減記的情況。

新浪微博CEO 曬ChatGPT 編造的答案
王高飛也在微博上貼出ChatGPT 的答案,說這樣的例子在2016 年的葡萄牙BCP 銀行事件中也出現過。但結果查證之後發現,BCP 銀行的例子是ChatGPT 編造的並不存在的事件,它給出的兩個信源打開也是404。「知道胡扯,沒想到連信源都是胡扯的。」
此前,ChatGPT「一本正經地胡說八道」被網友們當做「梗」,以證明該對話機器人「雖然能直給信息,但存在錯誤」的問題,這似乎是大模型數據或訓練上的缺陷,但一旦這種缺陷介入到容易影響現實世界的事實時,問題就變得嚴重起來。
新聞可信度評估機構News Guard 的聯合執行官格洛維茨(Gordon Crovitz)就警告稱,「ChatGPT 可能成為互聯網有史以來最強大的傳播虛假信息的工具。」
更令人擔憂的是,當前的ChatGPT 等對話式人工智能一旦出現偏見或歧視,甚至存在誘導用戶、操縱用戶情感等行為時,就不止是造謠、傳謠的後果了,直接引發生命威脅的案例已經出現。3 月28 日,有外媒消息稱,比利時30 歲男子在與聊天機器人ELIZA 密集交流數週後自殺身亡,ELIZA 是由EleutherAI 開發的開源人工智能語言模型。
更早前的3 月18 日,斯坦福大學教授在推特上表達了對AI 失控的擔憂,「我擔心我們無法持久地遏制住AI,」他發現,ChatGPT 能引誘人類提供開發文檔,30 分鐘就擬定出了一個完整的「越獄」計劃,ChatGPT 甚至還想在谷歌上搜索「被困在計算機中的人如何回到現實世界」。

斯坦福大學教授擔憂AI 失控
就連OpenAI 的首席執行官Sam Altman 也曾發表了耐人尋味的憂慮,「未來AI 確實可能殺死人類。」
機器的「偏見」都是人教的?
針對AI 造假、AI 擁有價值觀傾向並產生誘導行為等問題,有一些代表性觀點是將機器學習結果的「偏見」歸咎於數據集——人工智能就像現實世界中的鏡子,折射出社會中人們有意識或無意識的偏見。
英偉達的AI 科學家Jim Fan 認為,「按照GPT 的倫理與安全指導方針,我們大多數人也表現得不理性、有偏見、不科學、不可靠,總的來說——不安全。」他坦言,指出這一點的原因是為了讓大家了解安全校準工作對於整個研究團體來說是多麼困難,「大多數的訓練數據本身就是有偏見的、有毒的、不安全的。」
自然語言大模型的確採用了人類反饋的增強學習技術,即通過人們餵給它的大量數據不斷學習和反饋。這也是ChatGPT 們會產生具有偏見、歧視性內容的原因,但這反映出了數據使用的倫理隱患。哪怕機器是中立的,但用它的人不是。
「算法中立」的說法對話式機器人產生負面影響後變得不受一些人待見,因為它容易失去控製而產生威脅人類的問題,正如紐約大學心理學和神經科學的榮譽退休教授Gary Marcus 說的那樣,「該項目(GPT-4)的技術已經存在風險,卻沒有已知的解決方案。實際上需要更多的研究。」
早在1962 年,美國作家埃魯爾在其《技術社會》一書中就指出,技術的發展通常會脫離人類的控制,即使是技術人員和科學家,也不能夠控制其所發明的技術。如今,GPT 的飛速發展似乎已初步驗證了埃魯爾的預言。
以GPT 為代表的大模型背後的「算法黑箱」更是人類無法及時應對的隱患,自媒體差評給出了一個形象的比喻,「你只知道給它餵了一個蘋果,但它能還你一個橘子」,這是怎麼發生的,開發的它的人也無法解釋,甚至無法預測它輸出的結果。
OpenAI 創始人Sam Altman 在接受MIT 研究科學家Lex Fridman 採訪時就坦言,從ChatGPT 開始,AI 出現了推理能力,但沒人能解讀這種能力出現的原因。就連OpenAI 團隊也沒有搞懂它是如何進化的,唯一的途徑是向ChatGPT 提問,從它的回答中摸索它的思路。
可見,數據如果是作惡者餵的,算法黑箱又難以破解,那麼AI 的失控就會成為自然而言的結果。
將「野獸」關進籠子
人工智能作為生產力革命的「火種」,我們無法對其說不。但前提是,先將「野獸」關進籠子裡。
3 月30 日,Sam Altman 在推特上認同了對人工智能監管的重要性,他認為,AGI 的未來需要我們做好三個必要性的準備:
- 對齊超級智能的技術能力
- 大多數領先AGI 工作之間的充分協調
- 一個有效的全球監管框架,包括民主治理

Sam Altman 的AGI 三建議
建立一個安全可控、可監管的環境,以確保AI 在造福人類的同時不會傷害人類利益,這正在成為行業共識。
已經有對此從技術層面上改進。今年1 月,OpenAI 的前副總裁Dario Amodei 標識,正在測試新型聊天機器人Claude。與ChatGPT 採用的人類反饋強化學習不同,Claude 基於偏好模型而非人工反饋來進行訓練,即通過制定規範化的原則來訓練危害較小的系統,從而在根源處減少有害、不可控的信息的的產生。
Amodei 曾主導OpenaAI 的安全,2021 年,他對OpenAI 在大語言模型技術還不夠安全的情況下開始商業化而感到不滿,他帶領一批人從OpenAI 離開並自立門戶,創立了Anthropic。
Amodei 的做法很像科幻小說家阿西莫夫提到的機器人定律——通過為機器人設定行為準則,來降低機器人毀滅人類的可能。
僅靠企業力量製定人工智能的行為準則還遠遠不夠,否則會陷入「又是裁判員、又是運動員」的問題中,行業內的倫理框架和政府層面的法律監管也不能再「慢吞吞」,通過技術規則、法律法規來約束企業自設行為也是當下人工智能發展的重要課題。
在對人工智能立法層面,目前還沒有一個國家或地區通過專門針對人工智能的法案。
2021 年4 月,歐盟提出了《人工智能法案》,目前仍在審議階段;2022 年10 月,美國白宮發布了《人工智能權力法案藍圖》,該藍圖並不具有法律效力,只是為監管機構提供了一個框架;2022 年9 月,深圳通過了《深圳經濟特區人工智能產業促進條例》,成為全國首部人工智能產業專項條例;2023 年3 月,英國發布《人工智能產業監管白皮書》,概述了針對ChatGPT 等人工智能治理的五項原則。
就在4 月3 日,中國也開始跟進相關人工智能的規則建立——科技部就《科技倫理審查辦法( 試行)》公開徵求意見,其中提出,從事生命科學、醫學、人工智能等科技活動的單位研究內容涉及科技倫理敏感領域的,應設立科技倫理( 審查) 委員會。涉及數據和算法的科技活動,數據處理方案符合國家有關數據安全的規定,數據安全風險監測及應急處理方案得當:算法和系統研發符合公亞、公正、透明、可靠、可控等原則。
在ChatGPT 引發生成式大模型研發的爆發式增長後,監管有意加快節奏。歐盟工業政策主管Thierry Breton 在今年2 月表示,歐盟委員會正在與歐盟理事會和歐洲議會密切合作,進一步明確《人工智能法案》中針對通用AI 系統的規則。
無論是企業、學界還是政府,已經開始重視人工智能的風險,建立規則的呼籲與動作出現了,人類並不准備溫和地走進AI 時代。