Crypto 是 AI 的幻覺(jué)

訪客 1年前 (2024-02-26) 閱讀數(shù) 203 #區(qū)塊鏈
文章標(biāo)簽 前沿文章

來(lái)源:佐爺歪脖山

涌現(xiàn)(emergence):當(dāng)許多小的個(gè)體相互作用后產(chǎn)生了大的整體,而這個(gè)整體展現(xiàn)了構(gòu)成它的個(gè)體所不具備的新特性的現(xiàn)象,比如,生物學(xué)所研究的生命現(xiàn)象是化學(xué)的一個(gè)涌現(xiàn)特性。

幻覺(jué)(Hallucination):模型有輸出欺騙性數(shù)據(jù)的傾向,AI 模型的輸出看起來(lái)是正確的,實(shí)際上是錯(cuò)誤的。

AI 和 Crypto 的鏈接呈現(xiàn)出明顯的波段起伏特征,在 2016 年 AlphaGo 戰(zhàn)勝人類圍棋職業(yè)選手后,加密世界自發(fā)誕生了 Fetch.AI 等將兩者結(jié)合的嘗試,自從 2023 年 GPT-4 的橫空出世,這種 AI + Crypto 的熱潮再起,以 WorldCoin 發(fā)幣為代表,人類似乎要進(jìn)入一個(gè) AI 負(fù)責(zé)生產(chǎn)力,Crypto 負(fù)責(zé)分配的烏托邦時(shí)代。

這種情緒在 OpenAI 推出文生視頻應(yīng)用 Sora 后達(dá)到高潮,但既然是情緒,總有不理性的成分在,至少李一舟就屬于被誤傷的那一部分,比如

AI 的具體應(yīng)用和算法研發(fā)總被混為一談,Sora 和 GPT-4 背后的 Transformer 原理開(kāi)源,但是使用二者要給 OpenAI 付費(fèi);

AI 和 Crypto 的結(jié)合尚屬于 Crypto 的主動(dòng)貼近,而 AI 巨頭們尚未有明顯意愿,現(xiàn)階段 AI 能為 Crypto 做的大于 Crypto 能為 AI 做的;

在 Crypto 應(yīng)用中使用 AI 技術(shù) ≠ AI 和 Crypto 的融合,比如鏈游/GameFi/元宇宙/ Web3 Game/AW 中的數(shù)字人;

Crypto 能為 AI 技術(shù)發(fā)展做的,主要是在 AI 三要件算力、數(shù)據(jù)和模型上的去中心化、代幣激勵(lì)等方面的補(bǔ)強(qiáng);

WorldCoin 是二者結(jié)合的成功實(shí)踐,zkML 處于 AI 和 Crypto 的技術(shù)交叉點(diǎn),UBI 理論(人類基本收入)進(jìn)行了第一次大規(guī)模實(shí)踐。

我在本文會(huì)聚焦 Crypto 能為 AI 增益之處,當(dāng)前主打 AI 應(yīng)用的 Crypto 項(xiàng)目主要是噱頭,不便納入討論。

從線性回歸到 Transformer

長(zhǎng)期以來(lái),涉及 AI 話題的焦點(diǎn)是人工智能的“涌現(xiàn)”會(huì)不會(huì)造就《黑客帝國(guó)》中的機(jī)械智能體或者硅基文明,在人類和 AI 技術(shù)的相處上,此類擔(dān)憂一直存在,最近的是在 Sora 問(wèn)世后,而稍早前也有 GPT-4(2023)、AlphaGo(2016)和 1997 年IBM 的深藍(lán)擊敗國(guó)際象棋。

此類擔(dān)憂從未成真也是事實(shí),不如放松心態(tài),簡(jiǎn)要梳理下 AI 的作用機(jī)制。

我們從線性回歸出發(fā),其實(shí)就是一元一次方程,比如賈玲的減肥機(jī)制,就可以做如下歸納,x 和 y 分別代表攝入能量和體重的關(guān)系,即吃的越多自然長(zhǎng)得越胖,如果要減肥那么就要少吃。

但是,這樣會(huì)帶來(lái)一些問(wèn)題,第一,人類的身高和體重有生理極限, 3 米巨人和千斤大小姐不太容易出現(xiàn),因此考慮極限以外的情況缺乏意義;第二,單純的少吃多練,并不符合減肥的科學(xué)原理,嚴(yán)重時(shí)會(huì)損害身體。

我們引入 BMI (Body Mass Index)身體質(zhì)量指數(shù),即體重除以身高的平方來(lái)衡量二者的合理關(guān)系,并且通過(guò)吃、睡、練三個(gè)因子來(lái)衡量身高和體重的關(guān)系,因此我們需要三個(gè)參數(shù)和兩個(gè)輸出,明顯線性回歸是不夠用的,神經(jīng)網(wǎng)絡(luò)就此誕生,顧名思義,神經(jīng)網(wǎng)絡(luò)模仿的是人腦結(jié)構(gòu),思考次數(shù)越多,也有可能越合理,三思而后行,加多加深思考的次數(shù),即深度學(xué)習(xí)(我牽強(qiáng)附會(huì)亂說(shuō)的,大家理解意思就好)

AI 算法發(fā)展史簡(jiǎn)要說(shuō)明

但是層數(shù)的加深也不是無(wú)止境的,天花板依然存在,達(dá)到某個(gè)臨界值可能效果就會(huì)變差,因此通過(guò)更合理的方式理解既有信息之間的關(guān)系就變得很重要,比如深刻理解身高和體重之間更細(xì)致的關(guān)系,找到以往沒(méi)發(fā)現(xiàn)的因子,再或者賈玲找到頂級(jí)教練,但是不好意思直說(shuō)想減肥,那么就需要教練揣摩下賈玲到底啥意思。

減肥的意思

在這種場(chǎng)景下,賈玲和教練構(gòu)成編碼和解碼的對(duì)手,來(lái)回傳遞的意思代表了雙方的真正含義,但是不同于“我要減肥,給教練送禮”的直白,雙方真正的意圖被“意思”隱藏了起來(lái)。

我們注意到一個(gè)事實(shí),如果雙方往復(fù)的次數(shù)夠多,那么各個(gè)“意思”的含義也就更容易猜出來(lái),并且各個(gè)意思和賈玲和教練的關(guān)系也會(huì)越來(lái)越明確。

如果將這個(gè)模型擴(kuò)展,那就是通俗意思上的大模型(LLM,large language model),更精確的說(shuō)是大語(yǔ)言模型,考察的是詞句之間的上下文關(guān)系,但是目前的大模型都被擴(kuò)展,可以涉足圖像、視頻之類的場(chǎng)景。

在 AI 的光譜中,不論是簡(jiǎn)單的線性回歸還是極其復(fù)雜的 Transformer 都是算法或模型的一種,除此之外,還有算力和數(shù)據(jù)兩個(gè)要素。

說(shuō)明:AI 簡(jiǎn)要發(fā)展史 圖源:https://ourworldindata.org/brief-history-of-ai

簡(jiǎn)單來(lái)說(shuō),AI 就是吞吐數(shù)據(jù),進(jìn)行運(yùn)算,導(dǎo)出結(jié)果的機(jī)器,只不過(guò)和機(jī)器人等實(shí)物相比,AI 更虛擬一些,在算力、數(shù)據(jù)和模型三部分上,目前 Web2 商業(yè)化運(yùn)作流程如下:

數(shù)據(jù)分為公共數(shù)據(jù)、公司自有數(shù)據(jù)和商業(yè)數(shù)據(jù),需要專業(yè)的標(biāo)注等預(yù)處理環(huán)節(jié)才能使用,比如 Scale AI 公司就為目前主流 AI 公司提供數(shù)據(jù)預(yù)處理;

算力分為自建和云算力租賃兩種模式,GPU 硬件目前英偉達(dá)一家獨(dú)大,CUDA 庫(kù)老黃也準(zhǔn)備很多年,目前軟硬件生態(tài)一家獨(dú)大,其次是云服務(wù)廠商的算力租賃,比如微軟的 Azure、谷歌云和 AWS 等,很多提供一站式的算力和模型部署功能;

模型可以分為框架和算法兩類,模型之戰(zhàn)已經(jīng)終結(jié),谷歌的 TensorFlow 先來(lái)先涼,Meta 的 PyTorch 后發(fā)先至,但是不論是提出 TransFomer 的谷歌還是坐擁 PyTorch 的 Meta 都逐漸在商業(yè)化上落伍于 OpenAI,但是實(shí)力依舊不容小覷;算法目前 Transformer 一家獨(dú)大,各類大模型主要在數(shù)據(jù)源和細(xì)節(jié)上開(kāi)卷。

AI 運(yùn)作過(guò)程

如前所述,AI 應(yīng)用領(lǐng)域廣泛,比如 Vitalik 所說(shuō)的代碼修正早已經(jīng)投入使用,如果換個(gè)視角,Crypto 能為 AI 做的主要集中在非技術(shù)領(lǐng)域,比如去中心化的數(shù)據(jù)市場(chǎng)、去中心化的算力平臺(tái)等等,去中心化的 LLM 有一些實(shí)踐,但是要注意,用 AI 分析 Crypto 代碼和區(qū)塊鏈上大規(guī)模跑 AI 模型根本不是一回事,以及在 AI 模型中加一些 Crypto 因素也很難稱得上是完美結(jié)合。

Crypro 目前還是更擅長(zhǎng)生產(chǎn)和激勵(lì),異想天開(kāi)用 Crypto 強(qiáng)行改變 AI 的生產(chǎn)范式則大可不必,這屬于為賦新詞強(qiáng)說(shuō)愁,拿著錘子找釘子,Crypto 融入 AI 的工作流以及 AI 賦能 Crypto 才是合理選擇,以下是我總結(jié)的比較可能的結(jié)合點(diǎn):

去中心化的數(shù)據(jù)生產(chǎn),比如 DePIN 的數(shù)據(jù)采集,以及鏈上數(shù)據(jù)的開(kāi)放性,蘊(yùn)藏著交易數(shù)據(jù)的富礦,可用于金融分析、安全分析和訓(xùn)練數(shù)據(jù);

去中心化的預(yù)處理平臺(tái),傳統(tǒng)預(yù)訓(xùn)練并無(wú)不可攀越的技術(shù)壁壘,而在歐美大模型的背后,是第三世界人工標(biāo)注員的高強(qiáng)度勞動(dòng);

去中心化的算力平臺(tái),個(gè)人帶寬、GPU 算力等軟硬件資源的去中心化激勵(lì)和使用;

zkML,傳統(tǒng)的數(shù)據(jù)脫敏等隱私手段并不能完美解決問(wèn)題,zkML 可以隱藏?cái)?shù)據(jù)指向性,也可以有效評(píng)估開(kāi)源和閉源模型的真實(shí)性和有效性;

這四個(gè)角度是我能想到的 Crypto 能為 AI 賦能的場(chǎng)景,AI 是通用工具,AI ?For Crypto 的領(lǐng)域和項(xiàng)目就不再贅述,大家可以自行研究。

可以發(fā)現(xiàn),Crypto 目前主要在加密、隱私保護(hù)和經(jīng)濟(jì)學(xué)設(shè)計(jì)上發(fā)揮作用,技術(shù)結(jié)合點(diǎn)只有 zkML 有一些嘗試,這里可以開(kāi)一下腦洞,如果未來(lái) Solana TPS 真能跑到 10 萬(wàn)+,F(xiàn)ilecoin 和 Solana 結(jié)合又比較完美的話,能不能打造一個(gè)鏈上 LLM 環(huán)境,這樣能打造出一個(gè)真實(shí)的鏈上 AI,改變目前的 Crypto 附著于 AI,兩者地位不對(duì)等的關(guān)系呢?

Web3 加入 AI 工作流

無(wú)需多言,英偉達(dá) RTX 4090 顯卡是硬通貨,目前的某個(gè)東方大國(guó)很難獲得,但是更嚴(yán)重的是,個(gè)人、小公司和學(xué)術(shù)機(jī)構(gòu)也遭遇了顯卡危機(jī),畢竟大型商業(yè)公司才是氪金玩家,如果能在自購(gòu)、云廠商之外開(kāi)辟第三條道路,很明顯具備實(shí)際的商業(yè)價(jià)值,也就脫離了純粹的炒作,合理的邏輯應(yīng)該是“如果不用 Web3,則無(wú)法維持項(xiàng)目運(yùn)作”,這種才是 Web3 For AI 的正確姿勢(shì)。

Web3 視角下的 AI 工作流

數(shù)據(jù)之源:Grass 和 DePIN 汽車全家桶

Grass 由 Wynd Network 推出,Wynd Network是一個(gè)閑置帶寬售賣市場(chǎng),Grass 是一個(gè)開(kāi)放式的網(wǎng)絡(luò)數(shù)據(jù)獲取和分發(fā)渠道,不同于單純的數(shù)據(jù)收集和售賣,Grass 具備將數(shù)據(jù)清洗和驗(yàn)證功能,以規(guī)避越來(lái)越封閉的網(wǎng)絡(luò)環(huán)境,不僅如此,Grass 希望能直接對(duì)接上 AI 模型,為其提供直接可用的數(shù)據(jù)集,AI 的數(shù)據(jù)集需要專業(yè)處理,比如大量的人工微調(diào),以滿足 AI 模型的特殊需求。

擴(kuò)展一下,Grass 要解決數(shù)據(jù)售賣的問(wèn)題,而 Web3 的 DePIN 領(lǐng)域能生產(chǎn) AI 需要的數(shù)據(jù),主要集中在汽車的自動(dòng)駕駛上,傳統(tǒng)上的自動(dòng)駕駛需要對(duì)應(yīng)公司自行積累數(shù)據(jù),而 DIMO、Hivemapper 等項(xiàng)目直接運(yùn)行在汽車之上,采集越來(lái)越多的汽車駕駛信息和道路數(shù)據(jù)。

在以往的自動(dòng)駕駛中,需要汽車識(shí)別技術(shù)和高精地圖兩部分,而高精地圖等信息被四維圖新等公司長(zhǎng)期積累,形成事實(shí)上的行業(yè)壁壘,如果后來(lái)者借助 Web3 數(shù)據(jù)反而具備彎道超車的機(jī)會(huì)。

數(shù)據(jù)預(yù)處理:解放被 AI 奴役的人類

人工智能可以分成人工標(biāo)注和智能算法兩部分,第三世界,如肯尼亞和菲律賓等地區(qū)負(fù)責(zé)人工標(biāo)注等價(jià)值曲線最低的部分,而歐美的 AI 預(yù)處理公司拿走大頭收入,進(jìn)而出售給 AI 研發(fā)企業(yè)。

隨著 AI 的發(fā)展,更多的企業(yè)盯上這部分業(yè)務(wù),在競(jìng)爭(zhēng)下數(shù)據(jù)標(biāo)注的單價(jià)越來(lái)越低,該部分業(yè)務(wù)主要就是給數(shù)據(jù)打標(biāo)簽,類似識(shí)別驗(yàn)證碼的工作,并無(wú)技術(shù)門檻,甚至有 0.01 元人民幣的超低價(jià)。

圖源:https://aim.baidu.com/product/0793f1f1-f1cb-4f9f-b3a7-ef31335bd7f0

在這種情況下,諸如 Public AI 等 Web3 數(shù)據(jù)標(biāo)注平臺(tái)也具備實(shí)際商業(yè)市場(chǎng),鏈接 AI 企業(yè)和數(shù)據(jù)標(biāo)注民工,使用激勵(lì)體系取代單純的商業(yè)低價(jià)競(jìng)爭(zhēng)模式,但是要注意,Scale AI 等成熟企業(yè)的標(biāo)注技術(shù)保證可靠的質(zhì)量,而去中心化的數(shù)據(jù)標(biāo)注平臺(tái)如何控制質(zhì)量,禁止擼毛黨則是絕對(duì)剛需,本質(zhì)上這是 C2B2B 的企業(yè)服務(wù),單純的數(shù)據(jù)規(guī)模和數(shù)量并不能說(shuō)服企業(yè)。

硬件自由:Render Network 和 Bittensor

需要說(shuō)明,跟比特幣礦機(jī)不同,目前沒(méi)有專用的 Web3 AI 硬件,現(xiàn)存的算力、計(jì)算平臺(tái)都是成熟硬件疊加 Crypto 激勵(lì)層改造而來(lái),本質(zhì)上可以歸納為 DePIN 領(lǐng)域,但是和數(shù)據(jù)來(lái)源項(xiàng)目有所區(qū)別,故按照 AI 工作流寫在此處。

Render Network 是“老項(xiàng)目”,并不完全為 AI 準(zhǔn)備,最早致力于渲染工作,一如 Render 之名,2017 年開(kāi)始運(yùn)營(yíng),當(dāng)時(shí)的 GPU 還沒(méi)那么瘋狂,但是市場(chǎng)機(jī)遇已經(jīng)逐步出現(xiàn),GPU 顯卡市場(chǎng),尤其是高端顯卡被英偉達(dá)壟斷,高昂的價(jià)格阻礙渲染、AI 和元宇宙使用者的進(jìn)入,如果能在需求方和供給方構(gòu)建起通道,那么類似共享單車的經(jīng)濟(jì)模型就有機(jī)會(huì)成立。

并且 GPU 資源并不需要實(shí)際交接硬件,僅調(diào)配軟件資源即可,更值得一提的是,Render Network 在2023 年便轉(zhuǎn)投 Solana生態(tài),舍棄 Polygon,在 Solana 并未回暖之時(shí)的投奔也被時(shí)間證明是正確之舉,對(duì)于 GPU 使用和分配而言,高速網(wǎng)絡(luò)是一種剛需。

如果說(shuō) Render Network 是老項(xiàng)目,那么 Bittensor 則風(fēng)頭正盛。

BitTensor 建構(gòu)在波卡之上,其目標(biāo)是通過(guò)經(jīng)濟(jì)激勵(lì)訓(xùn)練 AI 模型,比拼各節(jié)點(diǎn)能否將 AI 模型訓(xùn)練至誤差最小或者效率最高,也是較為符合經(jīng)典的 AI 上鏈流程的 Crypto 項(xiàng)目,但是真正的訓(xùn)練過(guò)程依然需要英偉達(dá) GPU 和傳統(tǒng)平臺(tái),整體上類似 Kaggle 等競(jìng)賽平臺(tái)。

zkML 和 UBI:Worldcoin 的 AB 面

零知識(shí)機(jī)器學(xué)習(xí)(zkML)通過(guò)將 zk 技術(shù)引入 AI 模型訓(xùn)練過(guò)程,以此來(lái)解決數(shù)據(jù)泄露、隱私失效和模型驗(yàn)真的問(wèn)題,前兩者容易理解,zk 加密后的數(shù)據(jù)仍然可以被訓(xùn)練,但是不會(huì)再泄露個(gè)人或者隱私數(shù)據(jù)。

模型驗(yàn)真是指某些閉源模型的評(píng)估問(wèn)題,在 zk 技術(shù)加持下,可以設(shè)定某個(gè)目標(biāo)值,那么閉源模型可以通過(guò)驗(yàn)證結(jié)果的方式證明自己的能力,而無(wú)需公開(kāi)計(jì)算過(guò)程。

Worldcoin 不僅是較早設(shè)想 zkML 的主流項(xiàng)目,還是 UBI(人類基本收入)的擁躉,在其設(shè)想中,未來(lái) AI 的生產(chǎn)力將遠(yuǎn)超人類的需求上限,因此真正的問(wèn)題在于公平分配 AI 的福利,UBI 的理念將通過(guò) $WLD 代幣像全球用戶分享,因此必須進(jìn)行實(shí)人生物識(shí)別,以遵循公平原則。

當(dāng)然,目前的 zkML 和 UBI 還在早期實(shí)驗(yàn)階段,但是足夠有趣,我會(huì)持續(xù)關(guān)注。

結(jié)語(yǔ)

AI 的發(fā)展,以 Transformer 和 LLM 為代表的路線發(fā)展也會(huì)逐漸陷入瓶頸,一如線性回歸和神經(jīng)網(wǎng)絡(luò),畢竟不可能無(wú)限制增加模型參數(shù)或者數(shù)據(jù)量,繼續(xù)增加的邊際收益會(huì)遞減。

AI 也許是涌現(xiàn)出智慧的種子選手,但現(xiàn)在幻覺(jué)問(wèn)題十分嚴(yán)重,其實(shí)可以看出,目前認(rèn)為 Crypto 能改變 AI 的幻覺(jué)是一種自信,同時(shí)也是一種標(biāo)準(zhǔn)的幻覺(jué),Crypto 的加入很難從技術(shù)上解決幻覺(jué)問(wèn)題,但至少可以從公平、透明角度入手改變一些現(xiàn)狀。

參考文獻(xiàn):

OpenAI: “GPT-4 Technical Report”, 2023; arXiv:2303.08774.

Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin: “Attention Is All You Need”, 2017; arXiv:1706.03762.

Jared Kaplan, Sam McCandlish, Tom Henighan, Tom B. Brown, Benjamin Chess, Rewon Child, Scott Gray, Alec Radford, Jeffrey Wu, Dario Amodei: “Scaling Laws for Neural Language Models”, 2020; arXiv:2001.08361.

Hao Liu, Wilson Yan, Matei Zaharia, Pieter Abbeel: “World Model on Million-Length Video And Language With RingAttention”, 2024; arXiv:2402.08268.

Max Roser (2022) - “The brief history of artificial intelligence: The world has changed fast – what might be next?” Published online at OurWorldInData.org. Retrieved from: 'https://ourworldindata.org/brief-history-of-ai' [Online Resource]

An introduction to zero-knowledge machine learning (ZKML)

Understanding the Intersection of Crypto and AI

Grass is the Data Layer of AI

Bittensor: A Peer-to-Peer Intelligence Market

熱門
主站蜘蛛池模板: 这里只有精品网| 99视频免费在线观看| 曰批全过程免费视频免费看| 亚洲精品美女久久久久| 美国式禁忌免费看| 国产又爽又黄又无遮挡的激情视频| 68日本xxxⅹxxxxx18| 奇米影视7777狠狠狠狠色| 中文字幕一区视频| 日本在线视频WWW色影响| 亚洲va国产日韩欧美精品| 欧美色图亚洲激情| 免费A级毛片无码A| 给我个免费看片bd| 国产凌凌漆国语| 成人看片黄在线观看| 国产精品喷水在线观看| 99久久人妻精品免费二区| 好男人资源在线手机免费| 中文字幕亚洲区| 日本三级免费观看| 久久天天躁狠狠躁夜夜躁2014 | 国产精品乱码在线观看| 97免费人妻在线视频| 天天干视频在线| youjizz欧美| 希岛婚前侵犯中文字幕在线| 中日韩精品视频在线观看| 日韩AV无码久久一区二区| 五月婷婷狠狠干| 欧美一级高清免费播放| 亚洲国产超清无码专区| 正在播放黑人巨大视频| 亚洲视频手机在线| 男女边摸边吃奶边做免费观看| 午夜两性色视频免费网站| 美女网站在线观看视频免费的| 国产一级做a爰片...| 被黑化男配做到哭h| 国产亚洲综合成人91精品| 青青草国产在线|