Vitalik新文:未來(lái)治理新范式“AI引擎+人類方向盤”

訪客 4周前 (03-04) 閱讀數(shù) 96 #區(qū)塊鏈
文章標(biāo)簽 前沿文章

原文標(biāo)題:AI as the engine, humans as the steering wheel

作者:Vitalik,以太坊創(chuàng)始人;編譯:白水,喜來(lái)順財(cái)經(jīng)

如果你問(wèn)人們喜歡民主結(jié)構(gòu)的哪些方面,無(wú)論是政府、工作場(chǎng)所還是基于區(qū)塊鏈的DAO,你經(jīng)常會(huì)聽到相同的論點(diǎn):它們避免權(quán)力集中,它們?yōu)橛脩籼峁?qiáng)有力的保證,因?yàn)闆](méi)有一個(gè)人可以隨心所欲地完全改變系統(tǒng)的方向,它們可以通過(guò)收集許多人的觀點(diǎn)和智慧來(lái)做出更高質(zhì)量的決策。

如果你問(wèn)人們不喜歡民主結(jié)構(gòu)的哪些方面,他們經(jīng)常會(huì)給出相同的抱怨:普通選民不夠老練,因?yàn)槊總€(gè)選民只有很小的機(jī)會(huì)影響結(jié)果,很少有選民在決策中投入高質(zhì)量的思考,而且你經(jīng)常會(huì)得到低參與度(使系統(tǒng)易于攻擊)或事實(shí)上的中心化,因?yàn)槊總€(gè)人都默認(rèn)信任和復(fù)制一些有影響力的人的觀點(diǎn)。

這篇文章的目標(biāo)是探索一種范式,也許可以使用AI讓我們從民主結(jié)構(gòu)中獲益而沒(méi)有負(fù)面影響。“AI是引擎,人類是方向盤”。人類只向系統(tǒng)提供少量信息,可能只有幾百位,但都是經(jīng)過(guò)深思熟慮且質(zhì)量極高的。AI將這些數(shù)據(jù)視為“目標(biāo)函數(shù)”,并不知疲倦地做出大量決策,盡最大努力實(shí)現(xiàn)這些目標(biāo)。特別是,這篇文章將探討一個(gè)有趣的問(wèn)題:我們能否在不將單個(gè)AI置于中心的情況下做到這一點(diǎn),而是依靠任何AI(或人機(jī)混合體)都可以自由參與的競(jìng)爭(zhēng)性開放市場(chǎng)?

BcG3hVn6CGdh67liZCPlrVnXHAIVmrdpGm9P3uzD.jpeg

目錄

為什么不直接讓一個(gè)AI來(lái)掌管?

Futarchy

蒸餾人類判斷力

深度融資(Deep funding)

增加隱私

發(fā)動(dòng)機(jī)+方向盤設(shè)計(jì)的好處

為什么不直接讓一個(gè)AI來(lái)負(fù)責(zé)呢?

將人類偏好插入基于 AI 的機(jī)制的最簡(jiǎn)單方法是制作一個(gè) AI 模型,并讓人類以某種方式將他們的偏好輸入其中。有簡(jiǎn)單的方法可以做到這一點(diǎn):您只需將包含人員指令列表的文本文件放入系統(tǒng)提示中即可。然后,您可以使用眾多“代理 AI 框架”之一賦予 AI 訪問(wèn)互聯(lián)網(wǎng)的能力,將您組織的資產(chǎn)和社交媒體資料的密鑰交給它,您就大功告成了。

經(jīng)過(guò)幾次迭代后,這可能足以滿足許多用例的需求,我完全預(yù)計(jì)在不久的將來(lái),我們將看到許多涉及 AI 閱讀群組給出的指令(甚至實(shí)時(shí)閱讀群聊)并采取行動(dòng)的結(jié)構(gòu)。

這種結(jié)構(gòu)不理想的是作為長(zhǎng)期機(jī)構(gòu)的治理機(jī)制。長(zhǎng)期機(jī)構(gòu)應(yīng)具有的一個(gè)寶貴屬性是可信中立性。在我介紹這一概念的帖子中,我列出了可信中立性的四個(gè)寶貴屬性:

不要將特定的人或特定的結(jié)果寫入機(jī)制

開源且可公開驗(yàn)證的執(zhí)行

保持簡(jiǎn)單

不要經(jīng)常更改

LLM(或 AI 代理)滿足 0/4。該模型不可避免地在其訓(xùn)練過(guò)程中編碼了大量特定的人和結(jié)果偏好。有時(shí)這會(huì)導(dǎo)致 AI 的偏好方向令人驚訝,例如,看看最近的一項(xiàng)研究表明,主要的 LLM 更看重巴基斯坦的生活,而不是美國(guó)的生活(!!)。它可以是開放權(quán)重,但這遠(yuǎn)非開源;我們真的不知道在模型深處隱藏著什么魔鬼。它與簡(jiǎn)單相反:LLM 的 Kolmogorov 復(fù)雜度為數(shù)百億位,大約相當(dāng)于所有美國(guó)法律(聯(lián)邦 + 州 + 地方)的總和。而且由于 AI 發(fā)展迅速,你必須每三個(gè)月更改一次。

出于這個(gè)原因,我贊成在許多用例中探索的另一種方法是讓一個(gè)簡(jiǎn)單的機(jī)制成為游戲規(guī)則,讓 AI 成為玩家。正是這種洞察力使得市場(chǎng)如此有效:規(guī)則是一種相對(duì)愚蠢的產(chǎn)權(quán)體系,邊緣案件由法院系統(tǒng)裁決,該系統(tǒng)緩慢地積累和調(diào)整先例,而所有的情報(bào)都來(lái)自于“在邊緣”運(yùn)作的企業(yè)家。

eX5akh6Nb0PMI4ABlb8cQ6j0g3hn4OcvTEyDbuKy.jpeg

單個(gè)“游戲玩家”可以是 LLM、相互交互并調(diào)用各種互聯(lián)網(wǎng)服務(wù)的 LLM 群、各種 AI + 人類組合以及許多其他構(gòu)造;作為機(jī)制設(shè)計(jì)師,您不需要知道。理想目標(biāo)是擁有一個(gè)可以自動(dòng)運(yùn)行的機(jī)制 —— 如果該機(jī)制的目標(biāo)是選擇資助什么,那么它應(yīng)該盡可能地像比特幣或以太坊區(qū)塊獎(jiǎng)勵(lì)一樣。

這種方法的好處是:

它避免將任何單一模型納入機(jī)制;相反,你會(huì)得到一個(gè)由許多不同參與者和架構(gòu)組成的開放市場(chǎng),它們都有自己不同的偏見。開放模型、封閉模型、代理群、人類 + AI 混合體、機(jī)器人、無(wú)限猴子等都是公平的游戲;該機(jī)制不會(huì)歧視任何人。

該機(jī)制是開源的。雖然玩家不是,但游戲是開源的 —— 而且這是一種已經(jīng)被相當(dāng)充分理解的模式(例如,政黨和市場(chǎng)都以這種方式運(yùn)作)

該機(jī)制很簡(jiǎn)單,因此機(jī)制設(shè)計(jì)者將自己的偏見編碼到設(shè)計(jì)中的途徑相對(duì)較少

該機(jī)制不會(huì)改變,即使從現(xiàn)在開始直到奇點(diǎn),底層參與者的架構(gòu)每三個(gè)月需要重新設(shè)計(jì)一次。

指導(dǎo)機(jī)制的目標(biāo)是忠實(shí)地反映參與者的根本目標(biāo)。它只需要提供少量信息,但應(yīng)該是高質(zhì)量的信息。

你可以認(rèn)為該機(jī)制利用了提出答案和驗(yàn)證答案之間的不對(duì)稱性。這類似于數(shù)獨(dú)很難解決,但很容易驗(yàn)證解決方案是否正確。你 (i) 創(chuàng)建一個(gè)開放的市場(chǎng),讓玩家充當(dāng)“解題者”,然后 (ii) 維護(hù)一個(gè)由人類運(yùn)行的機(jī)制,執(zhí)行驗(yàn)證已提出解決方案的簡(jiǎn)單得多的任務(wù)。

Futarchy

Futarchy 最初由 Robin Hanson 提出,意為“為價(jià)值投票,但為信念押注”。投票機(jī)制選擇一組目標(biāo)(可以是任何目標(biāo),但前提是它們必須是可衡量的),然后將其組合成一個(gè)度量 M。當(dāng)您需要做出決定時(shí)(為簡(jiǎn)單起見,我們假設(shè)是 YES/NO),您會(huì)設(shè)置條件市場(chǎng):您要求人們押注 (i) 是否會(huì)選擇 YES 或 NO,(ii) 如果選擇 YES,則 M 的值,否則為零,(iii) 如果選擇 NO,則 M 的值,否則為零。有了這三個(gè)變量,您就可以確定市場(chǎng)是否認(rèn)為 YES 或 NO 對(duì) M 的值更有利。

OgWVXEuIRfs6sJjanF5tcOruiaB32UpbZLsg6Hw8.jpeg

“公司股票價(jià)格”(或者對(duì)于加密貨幣來(lái)說(shuō),代幣價(jià)格)是最常被引用的指標(biāo),因?yàn)樗苋菀桌斫夂秃饬浚摍C(jī)制可以支持多種指標(biāo):月活躍用戶、某些群體的自我報(bào)告幸福感中位數(shù)、一些可量化的去中心化指標(biāo)等。

Futarchy 最初是在人工智能時(shí)代之前發(fā)明的。然而,F(xiàn)utarchy 非常自然地符合上一節(jié)描述的“復(fù)雜的求解器、簡(jiǎn)單的驗(yàn)證器”范式,并且 Futarchy 中的交易者也可以是人工智能(或人類+人工智能的組合)。“求解器”(預(yù)測(cè)市場(chǎng)交易者)的作用是確定每個(gè)提議的計(jì)劃將如何影響未來(lái)指標(biāo)的價(jià)值。這很難。如果求解器正確,他們就會(huì)賺錢,如果求解器錯(cuò)誤,他們就會(huì)賠錢。驗(yàn)證者(對(duì)指標(biāo)進(jìn)行投票的人,如果他們注意到指標(biāo)被“操縱”或者變得過(guò)時(shí),就會(huì)調(diào)整指標(biāo),并確定指標(biāo)在未來(lái)某個(gè)時(shí)間的實(shí)際值)只需要回答一個(gè)更簡(jiǎn)單的問(wèn)題“該指標(biāo)現(xiàn)在的值是多少?”

蒸餾人類判斷力

蒸餾人類判斷是一類機(jī)制,其工作原理如下。有大量(想想:100 萬(wàn)個(gè))問(wèn)題需要回答。自然的例子包括:

此列表中的每個(gè)人對(duì)某個(gè)項(xiàng)目或任務(wù)的貢獻(xiàn)應(yīng)獲得多少榮譽(yù)?

這些評(píng)論中哪些違反了社交媒體平臺(tái)(或子社區(qū))的規(guī)則?

這些給定的以太坊地址中哪些代表真實(shí)且獨(dú)特的人?

這些物理對(duì)象中哪些對(duì)其環(huán)境的美學(xué)有積極或消極的貢獻(xiàn)?

您有一個(gè)團(tuán)隊(duì)可以回答這些問(wèn)題,但代價(jià)是要在每個(gè)答案上花費(fèi)大量精力。您只要求團(tuán)隊(duì)回答少數(shù)問(wèn)題(例如,如果總清單有 100 萬(wàn)項(xiàng),團(tuán)隊(duì)可能只會(huì)回答其中的 100 項(xiàng))。您甚至可以向團(tuán)隊(duì)提出間接問(wèn)題:不要問(wèn)“Alice 應(yīng)獲得總信用的百分之幾?”,而是問(wèn)“Alice 或 Bob 是否應(yīng)該獲得更多信用,以及多多少倍?”。在設(shè)計(jì)陪審團(tuán)機(jī)制時(shí),您可以重復(fù)使用現(xiàn)實(shí)世界中久經(jīng)考驗(yàn)的機(jī)制,如撥款委員會(huì)、法院(確定判決價(jià)值)、評(píng)估等,當(dāng)然,陪審團(tuán)參與者自己也可以使用新奇的 AI 研究工具來(lái)幫助他們找到答案。

然后,您允許任何人提交對(duì)整個(gè)問(wèn)題集的數(shù)字回答列表(例如,提供整個(gè)列表中每個(gè)參與者應(yīng)獲得多少信用的估計(jì)值)。鼓勵(lì)參與者使用人工智能來(lái)完成此任務(wù),但他們可以使用任何技術(shù):人工智能、人機(jī)混合、可以訪問(wèn)互聯(lián)網(wǎng)搜索并能夠自主雇用其他人類或人工智能工作者的人工智能、經(jīng)過(guò)控制論增強(qiáng)的猴子等。

一旦完整列表提供者和陪審員都提交了答案,就會(huì)根據(jù)陪審團(tuán)的答案對(duì)完整列表進(jìn)行檢查,并將與陪審團(tuán)答案最兼容的完整列表的某種組合作為最終答案。

蒸餾的人類判斷機(jī)制與 futarchy 不同,但有一些重要的相似之處:

在 futarchy 中,“解算者”會(huì)做出預(yù)測(cè),而他們的預(yù)測(cè)所依據(jù)的“真實(shí)數(shù)據(jù)”(用于獎(jiǎng)勵(lì)或懲罰解算者)是輸出指標(biāo)值的預(yù)言機(jī),由陪審團(tuán)運(yùn)行。

在蒸餾的人類判斷中,“解算者”會(huì)為大量問(wèn)題提供答案,而他們的預(yù)測(cè)所依據(jù)的“真實(shí)數(shù)據(jù)”是陪審團(tuán)提供的這些問(wèn)題中一小部分的高質(zhì)量答案。

exm0UEqPUEU7B2KRJfw4bHv5nv8GEhyRLMUSpQ04.jpeg

用于信用分配的蒸餾人類判斷的玩具示例,請(qǐng)參閱此處的 Python 代碼。腳本要求您擔(dān)任陪審團(tuán),并包含一些預(yù)先包含在代碼中的 AI 生成(和人類生成)完整列表。該機(jī)制識(shí)別最適合陪審團(tuán)答案的完整列表的線性組合。在這種情況下,獲勝組合是 0.199 * Claude 的答案 + 0.801 * Deepseek 的答案;這個(gè)組合比任何單個(gè)模型都更符合陪審團(tuán)的答案。這些系數(shù)也將是給予提交者的獎(jiǎng)勵(lì)。

在這個(gè)“擊敗索倫”的例子中,“人類作為方向盤”的方面體現(xiàn)在兩個(gè)地方。首先,每個(gè)問(wèn)題都應(yīng)用了高質(zhì)量的人類判斷,盡管這仍然利用陪審團(tuán)作為“技術(shù)官僚”績(jī)效評(píng)估者。其次,有一個(gè)隱含的投票機(jī)制,決定“擊敗索倫”是否是正確的目標(biāo)(而不是,比如說(shuō),試圖與索倫結(jié)盟,或?qū)⒛硹l關(guān)鍵河流以東的所有領(lǐng)土都交給他作為和平讓步)。還有其他蒸餾的人類判斷用例,其中陪審團(tuán)的任務(wù)更直接地帶有價(jià)值觀:例如,想象一個(gè)分散的社交媒體平臺(tái)(或子社區(qū)),陪審團(tuán)的工作是將隨機(jī)選擇的論壇帖子標(biāo)記為遵守或不遵守社區(qū)規(guī)則。

在蒸餾人類判斷范式中,存在一些開放變量:

如何進(jìn)行抽樣?完整名單提交者的作用是提供大量答案;陪審員的作用是提供高質(zhì)量的答案。我們需要以這樣的方式選擇陪審員,并為陪審員選擇問(wèn)題,即模型匹配陪審員答案的能力最大程度地表明其總體表現(xiàn)。一些考慮因素包括:

專業(yè)知識(shí)與偏見的權(quán)衡:熟練的陪審員通常專門從事其專業(yè)領(lǐng)域,因此讓他們選擇要評(píng)級(jí)的內(nèi)容,您將獲得更高質(zhì)量的輸入。另一方面,過(guò)多的選擇可能會(huì)導(dǎo)致偏見(陪審員偏愛(ài)與他們有聯(lián)系的人的內(nèi)容)或抽樣的弱點(diǎn)(某些內(nèi)容系統(tǒng)地未評(píng)級(jí))

反古德哈特:將有內(nèi)容試圖“玩弄”人工智能機(jī)制,例如,貢獻(xiàn)者生成大量看起來(lái)令人印象深刻但無(wú)用的代碼。這意味著陪審團(tuán)可以檢測(cè)到這一點(diǎn),但靜態(tài)人工智能模型除非他們努力嘗試,否則不會(huì)檢測(cè)到。捕捉這種行為的一種可能方法是添加一種挑戰(zhàn)機(jī)制,通過(guò)該機(jī)制,個(gè)人可以標(biāo)記此類嘗試,保證陪審團(tuán)對(duì)其進(jìn)行判斷(從而激勵(lì)人工智能開發(fā)人員確保正確捕捉它們)。如果陪審團(tuán)同意,舉報(bào)者將獲得獎(jiǎng)勵(lì),如果陪審團(tuán)不同意,則要支付罰款。

您使用什么評(píng)分函數(shù)?當(dāng)前深度資助試點(diǎn)中使用的一個(gè)想法是詢問(wèn)陪審員“A 還是 B 應(yīng)該獲得更多的信用,以及多多少?”。評(píng)分函數(shù)為 score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 for (A, B, juror_ratio) in jury_answers):也就是說(shuō),對(duì)于每個(gè)陪審團(tuán)答案,它會(huì)詢問(wèn)完整列表中的比率與陪審員提供的比率有多遠(yuǎn),并添加與距離平方成比例的懲罰(在對(duì)數(shù)空間中)。這是為了表明評(píng)分函數(shù)的設(shè)計(jì)空間很豐富,評(píng)分函數(shù)的選擇與您向陪審員提出哪些問(wèn)題的選擇有關(guān)。

您如何獎(jiǎng)勵(lì)完整列表提交者?理想情況下,您希望經(jīng)常給予多個(gè)參與者非零獎(jiǎng)勵(lì),以避免壟斷機(jī)制,但您也希望滿足以下屬性:參與者不能通過(guò)多次提交相同(或略微修改)的答案集來(lái)增加獎(jiǎng)勵(lì)。一種有希望的方法是直接計(jì)算最適合陪審團(tuán)答案的完整列表的線性組合(系數(shù)非負(fù)且總和為 1),并使用這些相同的系數(shù)來(lái)分割獎(jiǎng)勵(lì)。也可能有其他方法。

總的來(lái)說(shuō),目標(biāo)是采用已知有效、偏見最小化且經(jīng)受住了時(shí)間考驗(yàn)的人類判斷機(jī)制(例如,想象一下法院系統(tǒng)的對(duì)抗結(jié)構(gòu)如何包括爭(zhēng)議的兩方,他們擁有大量信息但有偏見,而法官擁有少量信息但可能沒(méi)有偏見),并使用開放的人工智能市場(chǎng)作為這些機(jī)制的合理高保真度和非常低成本的預(yù)測(cè)指標(biāo)(這類似于大預(yù)言模型“蒸餾”的工作方式)。

深度融資(deep funding)

深度融資是將人類蒸餾的判斷應(yīng)用于填寫“X 的信用有多少百分比屬于 Y?”圖上邊的權(quán)重問(wèn)題。

最簡(jiǎn)單的方法是直接用一個(gè)例子來(lái)說(shuō)明:

1Iuz9D6Ge2TFHr29H66pF9V8jmfrbBNwhn079k3k.jpeg

兩級(jí)深度融資示例的輸出:以太坊的思想起源。請(qǐng)?jiān)诖颂幉榭?Python 代碼。

這里的目標(biāo)是分配對(duì)以太坊的哲學(xué)貢獻(xiàn)的榮譽(yù)。讓我們看一個(gè)例子:

這里顯示的模擬深度融資輪次將 20.5% 的功勞歸于密碼朋克運(yùn)動(dòng),將 9.2% 的功勞歸于技術(shù)進(jìn)步主義。

在每個(gè)節(jié)點(diǎn)中,您都會(huì)提出一個(gè)問(wèn)題:它在多大程度上是原創(chuàng)貢獻(xiàn)(因此它值得為自己贏得功勞),在多大程度上是其他上游影響的重新組合?對(duì)于密碼朋克運(yùn)動(dòng),它有 40% 是新的,60% 是依賴項(xiàng)。

然后,您可以查看這些節(jié)點(diǎn)上游的影響:自由主義小政府主義和無(wú)政府主義為密碼朋克運(yùn)動(dòng)贏得了 17.3% 的功勞,但瑞士直接民主只獲得了 5%。

但請(qǐng)注意,自由主義小政府主義和無(wú)政府主義也啟發(fā)了比特幣的貨幣哲學(xué),因此它通過(guò)兩種途徑影響了以太坊的哲學(xué)。

要計(jì)算自由主義小政府主義和無(wú)政府主義對(duì)以太坊的總貢獻(xiàn)份額,你需要將每條路徑上的邊相乘,然后將路徑相加:0.205 * 0.6 * 0.173 + 0.195 * 0.648 * 0.201 ~= 0.0466。因此,如果你必須捐贈(zèng) 100 美元來(lái)獎(jiǎng)勵(lì)所有為以太坊的哲學(xué)做出貢獻(xiàn)的人,根據(jù)這一模擬的深度融資輪,自由主義小政府主義者和無(wú)政府主義者將獲得 4.66 美元。

這種方法旨在適用于那些在以前的工作基礎(chǔ)上進(jìn)行工作且結(jié)構(gòu)高度清晰的領(lǐng)域。學(xué)術(shù)界(想想:引用圖)和開源軟件(想想:庫(kù)依賴關(guān)系和分叉)就是兩個(gè)自然的例子。

一個(gè)運(yùn)作良好的深度資助系統(tǒng)的目標(biāo)是創(chuàng)建和維護(hù)一個(gè)全局圖,任何有興趣支持某個(gè)特定項(xiàng)目的資助者都能夠?qū)①Y金發(fā)送到代表該節(jié)點(diǎn)的地址,資金將根據(jù)圖邊緣的權(quán)重自動(dòng)傳播到其依賴項(xiàng)(并遞歸到它們的依賴項(xiàng)等)。

你可以想象一個(gè)去中心化協(xié)議使用內(nèi)置深度融資裝置來(lái)發(fā)行其代幣:協(xié)議內(nèi)的去中心化治理將選擇一個(gè)陪審團(tuán),陪審團(tuán)將運(yùn)行深度融資機(jī)制,因?yàn)閰f(xié)議會(huì)自動(dòng)發(fā)行代幣并將其存入與其自身對(duì)應(yīng)的節(jié)點(diǎn)。通過(guò)這樣做,協(xié)議以編程方式獎(jiǎng)勵(lì)其所有直接和間接貢獻(xiàn)者,讓人想起比特幣或以太坊區(qū)塊獎(jiǎng)勵(lì)如何獎(jiǎng)勵(lì)一種特定類型的貢獻(xiàn)者(礦工)。通過(guò)影響邊緣的權(quán)重,陪審團(tuán)可以不斷定義它重視的貢獻(xiàn)類型。這種機(jī)制可以作為挖礦、銷售或一次性空投的去中心化和長(zhǎng)期可持續(xù)的替代方案。

增加隱私

通常,要對(duì)上述示例中的問(wèn)題做出正確的判斷,需要能夠訪問(wèn)私人信息:組織的內(nèi)部聊天記錄、社區(qū)成員秘密提交的信息等。“僅使用單個(gè) AI”的一個(gè)好處,尤其是在規(guī)模較小的環(huán)境中,是讓一個(gè) AI 訪問(wèn)信息比向所有人公開信息更容易被接受。

為了在這些情況下使蒸餾的人類判斷或深度資助發(fā)揮作用,我們可以嘗試使用加密技術(shù)安全地讓 AI 訪問(wèn)私人信息。這個(gè)想法是使用多方計(jì)算 (MPC)、完全同態(tài)加密 (FHE)、可信執(zhí)行環(huán)境 (TEE) 或類似機(jī)制來(lái)提供私人信息,但僅限于其唯一輸出是直接放入機(jī)制中的“完整列表提交”的機(jī)制。

如果你這樣做,那么你就必須將機(jī)制集限制為 AI 模型(而不是人類或 AI + 人類組合,因?yàn)槟悴荒茏屓祟惪吹綌?shù)據(jù)),并且特定于在某些特定基底(例如 MPC、FHE、可信硬件)中運(yùn)行的模型。一個(gè)主要的研究方向是找出近期足夠有效、有意義的實(shí)用版本。

發(fā)動(dòng)機(jī)+方向盤設(shè)計(jì)的優(yōu)點(diǎn)

這樣的設(shè)計(jì)有許多令人期待的好處。迄今為止,最重要的好處是,它們?cè)试S構(gòu)建 DAO,讓人類選民控制方向,但他們不會(huì)被過(guò)多的決策所困擾。它們達(dá)到了折衷,每個(gè)人不必做出 N 個(gè)決定,但他們擁有的權(quán)力不僅僅是做出一個(gè)決定(委托通常如何運(yùn)作),而且更能引發(fā)難以直接表達(dá)的豐富偏好。

此外,這樣的機(jī)制似乎具有激勵(lì)平滑特性。我在這里所說(shuō)的“激勵(lì)平滑”是兩個(gè)因素的組合:

擴(kuò)散:投票機(jī)制采取的任何單一行動(dòng)都不會(huì)對(duì)任何單一參與者的利益產(chǎn)生過(guò)大影響。

混亂:投票決策與它們?nèi)绾斡绊憛⑴c者利益之間的聯(lián)系更加復(fù)雜且難以計(jì)算。

這里的混淆和擴(kuò)散這兩個(gè)術(shù)語(yǔ)取自密碼學(xué),它們是密碼和哈希函數(shù)安全的關(guān)鍵屬性。

當(dāng)今現(xiàn)實(shí)世界中激勵(lì)平滑的一個(gè)很好的例子是法治:政府高層不會(huì)定期采取“給愛(ài)麗絲的公司 2 億美元”、“罰款鮑勃的公司 1 億美元”等形式的行動(dòng),而是通過(guò)旨在均勻應(yīng)用于大量參與者的規(guī)則,然后由另一類參與者進(jìn)行解釋。當(dāng)這種方法奏效時(shí),好處是它大大減少了賄賂和其他形式腐敗的好處。當(dāng)它被違反時(shí)(在實(shí)踐中經(jīng)常發(fā)生),這些問(wèn)題很快就會(huì)被大大放大。

AI顯然將成為未來(lái)的重要組成部分,這將不可避免地成為未來(lái)治理的重要組成部分。但是,如果你讓AI參與治理,這有明顯的風(fēng)險(xiǎn):AI有偏見,它可能在訓(xùn)練過(guò)程中被故意破壞,而且AI技術(shù)發(fā)展如此之快,“讓AI掌權(quán)”可能實(shí)際上意味著“讓負(fù)責(zé)升級(jí)AI的人掌權(quán)”。蒸餾的人類判斷提供了一條前進(jìn)的替代道路,讓我們能夠以開放的自由市場(chǎng)方式利用AI的力量,同時(shí)保持人類控制的民主。

特別感謝 Devansh Mehta、Davide Crapis 和 Julian Zawistowski 的反饋和審查,以及 Tina Zhen、Shaw Walters 和其他人的討論。

熱門
主站蜘蛛池模板: 日韩毛片在线免费观看| 真实乱小说在线阅读| 国产精品久久久久影视不卡| www.99re| 无码专区一va亚洲v专区在线| 亚洲av日韩精品久久久久久久| 波多野结衣护士| 加勒比黑人在线| 色天天综合色天天害人害己| 国产成人免费高清激情视频| 2021国产麻豆剧果冻传媒影视| 天堂电影在线免费观看| 三级理论中文字幕在线播放| 日本妇乱子伦视频| 亚州**色毛片免费观看| 欧美成人精品第一区二区三区| 人妻va精品va欧美va| 精精国产XXXX视频在线播放| 国产亚洲av手机在线观看| 成人免费大片免费观看网站| 国产精品日韩欧美一区二区三区| 99精产国品一二三产| 宵宫被爆3d动画羞羞漫画 | 国产精品日韩欧美在线| 99热这里只有精品6免费| 好男人好资源影视在线| 中国老熟妇xxxxx| 日本按摩高潮a级中文片| 久草精品视频在线播放| 欧洲卡一卡二卡在线| 亚洲国产综合网| 欧美精品寂寞影院请用uc| 亚洲色图综合网| 狠狠色综合7777久夜色撩人| 免费大片在线观看网站| 精品国产亚洲一区二区三区| 啊灬啊灬啊灬快好深视频在线| 色吊丝免费观看网站| 国产三级a三级三级| 被强制侵犯的高贵冷艳人妇| 国产在线观看的|