ChatGPT 是有史以來增長最快的消費者應用程序,而且仍在迅速增長。
但AI 背後的真相是,仍然需要人類進行創建,標記和結構化訓練數據- 而訓練數據非常昂貴。不利的情況是,隨著AI 的不斷進步,對數據的反饋處理需求正成指數級增長;因此,如何在AI 的發展中管理其中的參與者成為一個很重要的問題。
一些專家認為,當智能機器人在世界範圍內普及的時候,他們最好由去中心化的網絡控制,並且人類是通過得到激勵的方式來貢獻數據集的。區塊鍊和代幣(通證)可以在這過程中提供幫助…但是區塊鏈能夠拯救人類免受AI 的傷害嗎?
ChatGPT 不是AGI(通用人工智能)
根據著名的AI 研究人員Ben Goertzel 的說法,ChatGPT 是一件大事,因為「ChatGPT 讓谷歌創始人多年來第一次出現在辦公室裡!」。Goertzel 是基於區塊鏈的AI 交易平台SingularityNET 的創始人,也是人工智能AGI(AGI:通用人工智能,也被稱作「強人工智能」)的堅定支持者- 讓計算機自己思考。這意味著他比大多數人更清楚地看到ChatGPT 的不足之處。(ChatGPT 屬於弱人工智能)
「ChatGPT 和其他神經模型的有趣之處在於,它們實現了一定程度的通用性,卻沒有太多的概括能力。他們通過擁有如此多的訓練數據,實現了相對於人類個體而言一定的能力範圍……換句話說,ChatGPT 實際上是通過擁有這麼多數據的蠻力實現的一種功能。」

Ben Goertzel 和他的機器人Desdemona(如何利用區塊鏈防止人工智能「消滅人類」)
「如果GPT-7 能夠完成80%的人類工作,我也不會感到震驚;這很重要,但這並不意味著它們可以成為人類水平的思維機器。但它們可以完成大多數人類水平的工作。」 Goertzel 說道。
對AI 來說,基於經驗的邏輯比抓取互聯網信息更難。謂詞邏輯意味著人類知道如何打開瓶蓋,但AI 需要數万億的數據才能學會這個簡單的任務。Goertzel 解釋說,好的大型語言模型(LLMs)仍然可以將語言轉換為推定邏輯,包括悖論邏輯或自相矛盾的邏輯。
「如果你把整個網絡作為AI 的食物,那麼幾乎任何你問它們的問題都可以在網絡上找到答案。」
Goertzel 在人工智能思維研究領域很重要,因為他專門研究AGI。Goertzel 表示自己和90%的AGI 同事認為像ChatGPT 等LLM 在一定程度上分散了人們希望「讓AI 可以自我思考」這一目標的注意力。但他補充說LLM 也可以促進和加速所有可能在AGI 中發揮作用的創新工作。例如,LLM 將加快編碼的進步。LLM 甚至可以幫助沒有編碼能力的普通人構建手機或網絡應用程序。這意味著非技術創始人可以使用LLM 構建技術創業公司。「人工智能應該使軟件技術的開發民主化,然後再稍微往前走一點,民主化硬件技術開發的民主化。」
Goertzel 創立了SingularityNET,試圖利用區塊鍊和開源技術,將控制AGI 的技術權力「分發」給每個人,而不是讓它留在壟斷者手中。Goertzel 指出,ChatGPT 和其他文本應用程序部署了公開可見的開源算法。因此,他們的數據集的安全基礎設施以及用戶如何參與這場技術革命,正處於一個關鍵時刻。
AI 開發同樣受到了許多質疑。三月,OpenAI 聯合創始人埃隆·馬斯克(Elon Musk)和其他1000 多名技術領導人呼籲暫停開發AI 或部署比GPT-4 更強大的系統。他們的公開信警告說,這將會給社會和人類帶來「深遠的風險」。信中提出,暫停可以為AI 系統實施「共享安全協議」提供時間。「如果這樣的暫停無法快速實施,政府應採取行動,實施暫停令。」
Goertzel 卻對技術改善我們生活的潛力比較樂觀,他從1970 年代就開始研究這一領域了。

在圖片中,Goertzel 反駁了馬斯克等人關於暫停GPT-4 研究的觀點:LLMs 不會變成AGI
一個信譽系統是必要的
Humayun Sheikh 是著名的AI 研究實驗室DeepMind 的創始投資者,他支持早期AI 和深度神經網絡技術的商業化。目前,他作為Fetch.ai 的首席執行官兼創始人,帶領著這家初創公司開發一個深度技術用以「自治未來」。
他認為,區塊鍊和AI 的交叉是經濟驅動的,因為除非是非常大型的公司或組織,否則訓練AI 模型所需的資金是非常昂貴的。「加密貨幣的整個前提是技術和金融的民主化。我們設想,與只有一個壟斷實體擁有重要AI 模型的所有權不同,區塊鏈可以將所有權分散給為其開發做出貢獻的人們。」
「為讓用戶(人們)可以持續地參與AI 訓練和發展的循環,我們可以採取的一種方法是從一開始就讓人們參與其中,這也是為什麼我們堅持將AI 技術去中心化。無論是從一開始讓人們訓練AI,還是讓他們測試和驗證AI 系統,確保普通人能夠擁有AI 模型的部分所有權是一種很好的方式來讓用戶(人們)留在「循環」中。我們希望做到這一點,同時讓這種民主以適當的激勵機制為基礎。」
為了達到這一目標,可以採用新興的信譽系統和去中心化的社交網絡。例如,SingularityNet 的分支產品Rejuve 正在對個人提交的生物數據進行代幣化和眾包,希望使用人工智能對其進行分析並將其與動物和昆蟲數據進行交叉匹配,從而發現基因組的哪些部分可以讓我們活得更久。這是一個基於AI 和Web3 的「長壽經濟」。在這個案例中,參與者參與了科學的開放並為結果做出了貢獻,因此數據提交者也應該因其貢獻而獲得獎勵。
「AI 的發展依賴於人類的訓練。信譽系統可以為數據提供質量保證,去中心化的社交網絡可以確保在開發過程中包含各種不同的想法和觀點。」
Sheikh 指出,基於區塊鏈的人工智能治理也能有所幫助,他說,通過每個人都能看到的收集的數據和做出決定的無可爭議的記錄,能確保決策的透明度和去中心化。但區塊鏈技術只是拼圖的一部分。他說:”規則和標準,正如我們在DAO 中看到的那樣,總是需要可信的治理。
Goertzel 指出:「你無法買賣別人的信譽」,而代幣具有網絡效應。基於區塊鏈的人工智能信譽系統可以確保消費者區分AI 假冒品(原文:AI fakes)和真人,同時也可以確保透明度,以便人工智能模型的構建者可以為他們的人工智能構建負責。在這種觀點下,需要在區塊鏈社區,然後在主流技術生態系統中採用一些標準,對信譽進行代幣化衡量。
而反過來,信譽系統可以加速人工智能的創新。”這不是快速賺錢的道路,但它是區塊鍊主導全球經濟道路的一部分。在信譽領域,區塊鏈有一點「公地悲劇」(公地悲劇是經濟學中的一個問題,發生在個人為了追求個人利益而忽視社會福利的時候)的感覺;但每個人都將從一個共享的信譽系統中受益。
將區塊鏈用於數據集管理
AI 與數據結合可以做很多事情– 但全球各國政府都非常關注如何管理數據。
關鍵問題是誰擁有數據集。開源和閉源之間的區別變得模糊,它們之間的相互作用變得非常微妙。AI 算法通常是開源的,但數據集的參數和數據集本身通常是專有的和封閉的,包括ChatGPT。
公眾不知道用來訓練ChatGPT-4 的數據是什麼,因此即使算法是公開的,AI 也無法複製。各種人都推測它是使用谷歌和推特的數據集進行訓練的;谷歌卻否認它曾使用數據和與ChatGPT 對話的方式訓練自己的名為Bard 的AI,這進一步模糊了誰擁有什麼(What)以及「如何做到」(How)的問題。
知名的AI 風險投資人李開復經常說,開源AI 是歷史上最偉大的人類合作,AI 研究論文通常包含它們的數據集以便重現,或供他人復制。但是儘管Lee 發表了這番言論,當數據與學術研究相關時,往往會被貼上錯誤的標籤,Goertzel 說道。即使是開放數據集,比如學術論文,也可能不成熟,標記錯誤,無用且通常很難復制。
因此,AI 與區塊鏈的結合將在數據預處理領域發揮很大作用。加密公司和DAO 有機會為用於清理訓練數據集的去中心化基礎設施創建工具。開源代碼是一回事,但保護數據至關重要。
Goertzel 指出,「您需要有辦法獲得實時的AI 模型,但最終,有人必須為運行該過程的計算機付費」,這可能意味著讓用戶通過訂閱模型付費訪問AI;但是,代幣經濟是一種更「自然」的選擇。那麼,為什麼不激勵好的數據集用於進行進一步的研究呢?諸如基因組學數據之類的「數據分析管道」可以由加密公司/DAO 構建。LLMs 已經可以做這些事情了,但「大多數這些預處理步驟可以由去中心化的方式(分佈式的計算機)更好地完成,」Goertzel 說,「但要構建它需要很多工作。」
人與AI 的協作:海量的數據需要負責任的管理者
加拿大Ocean Protocol 創始人Trent McConaghy 說,考慮人與AI 協作的一種實用方法是「計算機輔助設計」(CAD,computer-aided design,指利用計算機及其圖形設備幫助設計人員進行設計工作)的概念。自1980 年代以來,工程師已經從AI 支持的CAD 中受益。「這是一個重要的框架:人類與計算機共同努力完成目標,同時利用雙方的優勢,」他說。
McConaughy 從1990 年代開始為加拿大政府工作,並且花了15 年時間為電路設計開發AI 支持的CAD 工具。他在2016 年寫了有關AI 的第一篇重要文章。
CAD 為我們提供了一種實際的人與AI 協作的框架。但是,這些AI 支持的CAD 工具仍然需要數據。

圖片內容:「想像一下手畫一個擁有100 億個部件的芯片… 但是,人們還是做到了,你知道是如何做到的嗎?答案是使用人工智能…
McConaughy 於2017 年創立了Ocean Protocol,以解決這一問題。Ocean Protocol 是一個公共服務網絡,可以安全共享AI 數據,同時保護隱私。「這是一款利用區塊鏈的AI 技術,旨在為地球民眾改善數據狀況。」令人印象深刻的是,它是GitHub 上第六活躍的加密項目。
區塊鏈對於將數據交到普通人手中有很多可談的優勢。就像Goertzel 一樣,McConaghy 相信分佈式計算機可以為保護AI 不被惡意使用做出重要貢獻。IPFS、Filecoin、Ocean Protocol 和其他分佈式數據控制者已經在過去幾年裡開展了這項任務。
Ocean 上的數據農場(原文:Data farming)已經激勵人們挑選他們認為可以用於AI 開發的高活躍度數據資產。例如,企業數據市場Acentrik、企業AI 助理Algovera 以及分佈式數據科學競賽協議Desights。McConaghy 說:「AI 人員面臨的問題是獲取更多數據和更多數據的來源。」
區塊鏈可以幫助AI 安全地共享數據(原始訓練數據、模型和原始訓練預測),具有不可更改性、來源性、抗審查性和隱私性等特點。
McConaghy 將其視為兩者結合的重大優勢。「AI 將數據轉化為價值,但人類必須決定哪些是好的數據資產。」
Ocean Protocol 已經進一步發展出了一個AI 數據經濟的基礎。它將數據資產以代幣化,使人們可以將有價值的數據作為NFT 和代幣發布,在錢包中持有它們,將它們放在數據DEX 上出售,甚至在數據DAO 中管理它們。通過利用DeFi 工具,將數據代幣化解鎖了數據經濟;但這些努力會在人工智能之前成為主流嗎?

Trent McConaghy, Ocean Protocal 創始人,目標創建一個數據交易市場
去中心化計算機可以為自主機器人服務
AGI 是指計算機開始自主思考,並構建更好的自身源代碼版本。Goertzel 解釋說:「人類水平的AGI 可以閱讀自身的源代碼、現有的數學和計算機科學,並可以復制自身以進行實驗,然後構建下一級- ASI 人工超級智能。」
在Goertzel 的看法中,這項技術由每個人來指導要比由某個科技公司或國家單獨控制要好得多。
「如果你把AGI 系統部署到全球數百萬台計算機上,沒有人可以拿著槍對你說「給我係統」- 區塊鏈解決了這個問題,對嗎?區塊鏈比解決貨幣問題更能解決這個問題,」Goertzel 認為。
Goertzel 具體定義AGI 為「具有超越其編程和培訓的強大能力的軟件或硬件;它能夠創造出超越其獲取的信息的重大創造性飛躍。」
「按照我的估計,我們現在距離人類水平的AGI 只有三到八年的路程,然後再過幾年就可以到達超人類AGI。我們正生活在一個有趣的時代。」
在中期,也就是未來三到五到八年,我們將看到強烈依賴數據的AI 取得突破,達到人類水平,然後在此之後發生什麼?」
許多人都認為,AI 發展的下一步可能是區塊鏈治理的重要用例之一。「AGI 將促使世界領導人聚集在一起。AGI 需要開源運行在散佈於地球各地的數百萬台機器上,」Goertzel 說。「因此,沒有國家可以控制它,也沒有公司可以控制它。」
去中心化技術不是完美的解決方案
凱(Kai)教授是香港科技大學計算機科學與工程的教授,也是伯克利國際計算機科學研究所的傑出研究學者,他同意,使AI 民主化的關鍵瓶頸是運行AI 的巨大計算資源。但他不確定去中心化技術能否成為完美的解決方案。他說:「如果我們不解決眼下的問題,我們永遠都到不了終結者的階段。現在存在人工智能在潛移默化中撕裂社會的問題;我們需要解決人類的偏見,以及AI 的偏見問題。」
他說,去中心化技術仍然是高度實驗性的,而這些Web2 問題必須首先解決,因為它們正在給我們帶來當前的問題。
「AI 在一些事情上做出的決定往往是人們在生活中無法察覺到的;搜索引擎、YouTube、TikTok——他們決定的事情你往往無法察覺,但卻創造出更多兩極分化的觀點,並導致難以為繼的國內和地緣政治分裂。」
凱表示,數據集的透明度至關重要,但如果數據集是整個互聯網,那麼該數據集實際上是開源的。他認為,谷歌是100% 在互聯網上訓練的,而LLMs 很快就會迅速取代搜索引擎的算法;LLMs 可以近乎100% 地從互聯網上訓練出來。
因此,凱對區塊鏈能解決混亂的AI 問題的觀點提出質疑。
「這種說法[人工智能的分散計算]的反面是,AI 更加自主並可能導致電影「終結者」中的天網(Skynet)的情景出現。這種分佈式的計算能力並不是解決方案,因為你可能無意中導致人工智能軍團的出現。」
那麼最好的解決方案是什麼?「去中心化有一定的用處,但不是萬能藥;Web2 已經製造了很多意想不到的後果,我們需要從中吸取教訓,並且認識到區塊鍊是一種可以提供許多優勢的基礎技術,但仍然不是萬能的解決方案。」
但當然,並非所有在網上的數據都能免費使用:科學研究、醫療數據、應用程序收集的個人數據以及其他大量的私人擁有的數據可以用來訓練AI。
他表示,其中一個最有用的工具是創建大規模的模擬,看看這一切可能如何發揮作用。他說,問題是「我們該去中心化什麼,以及不去中心化什麼」。

由於AI 所引發的社會問題已經呈指數級增長,因此任何可行的解決方案也必須由AI 來實現
結論:使用區塊鏈可以進行更好的數據預處理
因此,區塊鏈+ AI 的最佳組合是什麼?Sheikh 認為:「將區塊鏈視為主流AI 開發中的關鍵部分,將是一個極好的組合。」
「我們認為,將AI 模型查看的所有數據都集中在一個地方並不是最佳的AI 開發方式。相反,通過使訓練模型的人類擁有自己的數據並根據對結果的準確程度受到激勵,將進一步加速AI 的應用。這樣的平台上的AI 模型可以更具可擴展性和可持續性,並具有更好的安全性和隱私性。」
De Kai 同樣擔心:「在70-80 年代,我們在AI 方面犯最大的錯誤之一就是假定我們所做的一切都是正確的。我們現在必須再次測試我們的假設。」