Vitalik新文：未來(lái)治理新范式“AI引擎+人類方向盤”

訪客 4周前 (03-04) 閱讀數(shù) 96 #區(qū)塊鏈

文章標(biāo)簽前沿文章

原文標(biāo)題：AI as the engine, humans as the steering wheel

作者：Vitalik，以太坊創(chuàng)始人；編譯：白水，喜來(lái)順財(cái)經(jīng)

如果你問(wèn)人們喜歡民主結(jié)構(gòu)的哪些方面，無(wú)論是政府、工作場(chǎng)所還是基于區(qū)塊鏈的DAO，你經(jīng)常會(huì)聽到相同的論點(diǎn)：它們避免權(quán)力集中，它們?yōu)橛脩籼峁?qiáng)有力的保證，因?yàn)闆](méi)有一個(gè)人可以隨心所欲地完全改變系統(tǒng)的方向，它們可以通過(guò)收集許多人的觀點(diǎn)和智慧來(lái)做出更高質(zhì)量的決策。

如果你問(wèn)人們不喜歡民主結(jié)構(gòu)的哪些方面，他們經(jīng)常會(huì)給出相同的抱怨：普通選民不夠老練，因?yàn)槊總€(gè)選民只有很小的機(jī)會(huì)影響結(jié)果，很少有選民在決策中投入高質(zhì)量的思考，而且你經(jīng)常會(huì)得到低參與度（使系統(tǒng)易于攻擊）或事實(shí)上的中心化，因?yàn)槊總€(gè)人都默認(rèn)信任和復(fù)制一些有影響力的人的觀點(diǎn)。

這篇文章的目標(biāo)是探索一種范式，也許可以使用AI讓我們從民主結(jié)構(gòu)中獲益而沒(méi)有負(fù)面影響。“AI是引擎，人類是方向盤”。人類只向系統(tǒng)提供少量信息，可能只有幾百位，但都是經(jīng)過(guò)深思熟慮且質(zhì)量極高的。AI將這些數(shù)據(jù)視為“目標(biāo)函數(shù)”，并不知疲倦地做出大量決策，盡最大努力實(shí)現(xiàn)這些目標(biāo)。特別是，這篇文章將探討一個(gè)有趣的問(wèn)題：我們能否在不將單個(gè)AI置于中心的情況下做到這一點(diǎn)，而是依靠任何AI（或人機(jī)混合體）都可以自由參與的競(jìng)爭(zhēng)性開放市場(chǎng)？

為什么不直接讓一個(gè)AI來(lái)負(fù)責(zé)呢？

將人類偏好插入基于 AI 的機(jī)制的最簡(jiǎn)單方法是制作一個(gè) AI 模型，并讓人類以某種方式將他們的偏好輸入其中。有簡(jiǎn)單的方法可以做到這一點(diǎn)：您只需將包含人員指令列表的文本文件放入系統(tǒng)提示中即可。然后，您可以使用眾多“代理 AI 框架”之一賦予 AI 訪問(wèn)互聯(lián)網(wǎng)的能力，將您組織的資產(chǎn)和社交媒體資料的密鑰交給它，您就大功告成了。

經(jīng)過(guò)幾次迭代后，這可能足以滿足許多用例的需求，我完全預(yù)計(jì)在不久的將來(lái)，我們將看到許多涉及 AI 閱讀群組給出的指令（甚至實(shí)時(shí)閱讀群聊）并采取行動(dòng)的結(jié)構(gòu)。

這種結(jié)構(gòu)不理想的是作為長(zhǎng)期機(jī)構(gòu)的治理機(jī)制。長(zhǎng)期機(jī)構(gòu)應(yīng)具有的一個(gè)寶貴屬性是可信中立性。在我介紹這一概念的帖子中，我列出了可信中立性的四個(gè)寶貴屬性：

不要將特定的人或特定的結(jié)果寫入機(jī)制

開源且可公開驗(yàn)證的執(zhí)行

保持簡(jiǎn)單

不要經(jīng)常更改

LLM（或 AI 代理）滿足 0/4。該模型不可避免地在其訓(xùn)練過(guò)程中編碼了大量特定的人和結(jié)果偏好。有時(shí)這會(huì)導(dǎo)致 AI 的偏好方向令人驚訝，例如，看看最近的一項(xiàng)研究表明，主要的 LLM 更看重巴基斯坦的生活，而不是美國(guó)的生活（！！）。它可以是開放權(quán)重，但這遠(yuǎn)非開源；我們真的不知道在模型深處隱藏著什么魔鬼。它與簡(jiǎn)單相反：LLM 的 Kolmogorov 復(fù)雜度為數(shù)百億位，大約相當(dāng)于所有美國(guó)法律（聯(lián)邦 + 州 + 地方）的總和。而且由于 AI 發(fā)展迅速，你必須每三個(gè)月更改一次。

出于這個(gè)原因，我贊成在許多用例中探索的另一種方法是讓一個(gè)簡(jiǎn)單的機(jī)制成為游戲規(guī)則，讓 AI 成為玩家。正是這種洞察力使得市場(chǎng)如此有效：規(guī)則是一種相對(duì)愚蠢的產(chǎn)權(quán)體系，邊緣案件由法院系統(tǒng)裁決，該系統(tǒng)緩慢地積累和調(diào)整先例，而所有的情報(bào)都來(lái)自于“在邊緣”運(yùn)作的企業(yè)家。

單個(gè)“游戲玩家”可以是 LLM、相互交互并調(diào)用各種互聯(lián)網(wǎng)服務(wù)的 LLM 群、各種 AI + 人類組合以及許多其他構(gòu)造；作為機(jī)制設(shè)計(jì)師，您不需要知道。理想目標(biāo)是擁有一個(gè)可以自動(dòng)運(yùn)行的機(jī)制 —— 如果該機(jī)制的目標(biāo)是選擇資助什么，那么它應(yīng)該盡可能地像比特幣或以太坊區(qū)塊獎(jiǎng)勵(lì)一樣。

這種方法的好處是：

它避免將任何單一模型納入機(jī)制；相反，你會(huì)得到一個(gè)由許多不同參與者和架構(gòu)組成的開放市場(chǎng)，它們都有自己不同的偏見。開放模型、封閉模型、代理群、人類 + AI 混合體、機(jī)器人、無(wú)限猴子等都是公平的游戲；該機(jī)制不會(huì)歧視任何人。

該機(jī)制是開源的。雖然玩家不是，但游戲是開源的 —— 而且這是一種已經(jīng)被相當(dāng)充分理解的模式（例如，政黨和市場(chǎng)都以這種方式運(yùn)作）

該機(jī)制很簡(jiǎn)單，因此機(jī)制設(shè)計(jì)者將自己的偏見編碼到設(shè)計(jì)中的途徑相對(duì)較少

該機(jī)制不會(huì)改變，即使從現(xiàn)在開始直到奇點(diǎn)，底層參與者的架構(gòu)每三個(gè)月需要重新設(shè)計(jì)一次。

指導(dǎo)機(jī)制的目標(biāo)是忠實(shí)地反映參與者的根本目標(biāo)。它只需要提供少量信息，但應(yīng)該是高質(zhì)量的信息。

你可以認(rèn)為該機(jī)制利用了提出答案和驗(yàn)證答案之間的不對(duì)稱性。這類似于數(shù)獨(dú)很難解決，但很容易驗(yàn)證解決方案是否正確。你 (i) 創(chuàng)建一個(gè)開放的市場(chǎng)，讓玩家充當(dāng)“解題者”，然后 (ii) 維護(hù)一個(gè)由人類運(yùn)行的機(jī)制，執(zhí)行驗(yàn)證已提出解決方案的簡(jiǎn)單得多的任務(wù)。

Futarchy

Futarchy 最初由 Robin Hanson 提出，意為“為價(jià)值投票，但為信念押注”。投票機(jī)制選擇一組目標(biāo)（可以是任何目標(biāo)，但前提是它們必須是可衡量的），然后將其組合成一個(gè)度量 M。當(dāng)您需要做出決定時(shí)（為簡(jiǎn)單起見，我們假設(shè)是 YES/NO），您會(huì)設(shè)置條件市場(chǎng)：您要求人們押注 (i) 是否會(huì)選擇 YES 或 NO，(ii) 如果選擇 YES，則 M 的值，否則為零，(iii) 如果選擇 NO，則 M 的值，否則為零。有了這三個(gè)變量，您就可以確定市場(chǎng)是否認(rèn)為 YES 或 NO 對(duì) M 的值更有利。

“公司股票價(jià)格”（或者對(duì)于加密貨幣來(lái)說(shuō)，代幣價(jià)格）是最常被引用的指標(biāo)，因?yàn)樗苋菀桌斫夂秃饬浚摍C(jī)制可以支持多種指標(biāo)：月活躍用戶、某些群體的自我報(bào)告幸福感中位數(shù)、一些可量化的去中心化指標(biāo)等。

Futarchy 最初是在人工智能時(shí)代之前發(fā)明的。然而，F(xiàn)utarchy 非常自然地符合上一節(jié)描述的“復(fù)雜的求解器、簡(jiǎn)單的驗(yàn)證器”范式，并且 Futarchy 中的交易者也可以是人工智能（或人類+人工智能的組合）。“求解器”（預(yù)測(cè)市場(chǎng)交易者）的作用是確定每個(gè)提議的計(jì)劃將如何影響未來(lái)指標(biāo)的價(jià)值。這很難。如果求解器正確，他們就會(huì)賺錢，如果求解器錯(cuò)誤，他們就會(huì)賠錢。驗(yàn)證者（對(duì)指標(biāo)進(jìn)行投票的人，如果他們注意到指標(biāo)被“操縱”或者變得過(guò)時(shí)，就會(huì)調(diào)整指標(biāo)，并確定指標(biāo)在未來(lái)某個(gè)時(shí)間的實(shí)際值）只需要回答一個(gè)更簡(jiǎn)單的問(wèn)題“該指標(biāo)現(xiàn)在的值是多少？”

蒸餾人類判斷力

蒸餾人類判斷是一類機(jī)制，其工作原理如下。有大量（想想：100 萬(wàn)個(gè)）問(wèn)題需要回答。自然的例子包括：

此列表中的每個(gè)人對(duì)某個(gè)項(xiàng)目或任務(wù)的貢獻(xiàn)應(yīng)獲得多少榮譽(yù)？

這些評(píng)論中哪些違反了社交媒體平臺(tái)（或子社區(qū)）的規(guī)則？

這些給定的以太坊地址中哪些代表真實(shí)且獨(dú)特的人？

這些物理對(duì)象中哪些對(duì)其環(huán)境的美學(xué)有積極或消極的貢獻(xiàn)？

您有一個(gè)團(tuán)隊(duì)可以回答這些問(wèn)題，但代價(jià)是要在每個(gè)答案上花費(fèi)大量精力。您只要求團(tuán)隊(duì)回答少數(shù)問(wèn)題（例如，如果總清單有 100 萬(wàn)項(xiàng)，團(tuán)隊(duì)可能只會(huì)回答其中的 100 項(xiàng)）。您甚至可以向團(tuán)隊(duì)提出間接問(wèn)題：不要問(wèn)“Alice 應(yīng)獲得總信用的百分之幾？”，而是問(wèn)“Alice 或 Bob 是否應(yīng)該獲得更多信用，以及多多少倍？”。在設(shè)計(jì)陪審團(tuán)機(jī)制時(shí)，您可以重復(fù)使用現(xiàn)實(shí)世界中久經(jīng)考驗(yàn)的機(jī)制，如撥款委員會(huì)、法院（確定判決價(jià)值）、評(píng)估等，當(dāng)然，陪審團(tuán)參與者自己也可以使用新奇的 AI 研究工具來(lái)幫助他們找到答案。

然后，您允許任何人提交對(duì)整個(gè)問(wèn)題集的數(shù)字回答列表（例如，提供整個(gè)列表中每個(gè)參與者應(yīng)獲得多少信用的估計(jì)值）。鼓勵(lì)參與者使用人工智能來(lái)完成此任務(wù)，但他們可以使用任何技術(shù)：人工智能、人機(jī)混合、可以訪問(wèn)互聯(lián)網(wǎng)搜索并能夠自主雇用其他人類或人工智能工作者的人工智能、經(jīng)過(guò)控制論增強(qiáng)的猴子等。

一旦完整列表提供者和陪審員都提交了答案，就會(huì)根據(jù)陪審團(tuán)的答案對(duì)完整列表進(jìn)行檢查，并將與陪審團(tuán)答案最兼容的完整列表的某種組合作為最終答案。

蒸餾的人類判斷機(jī)制與 futarchy 不同，但有一些重要的相似之處：

在 futarchy 中，“解算者”會(huì)做出預(yù)測(cè)，而他們的預(yù)測(cè)所依據(jù)的“真實(shí)數(shù)據(jù)”（用于獎(jiǎng)勵(lì)或懲罰解算者）是輸出指標(biāo)值的預(yù)言機(jī)，由陪審團(tuán)運(yùn)行。

在蒸餾的人類判斷中，“解算者”會(huì)為大量問(wèn)題提供答案，而他們的預(yù)測(cè)所依據(jù)的“真實(shí)數(shù)據(jù)”是陪審團(tuán)提供的這些問(wèn)題中一小部分的高質(zhì)量答案。

用于信用分配的蒸餾人類判斷的玩具示例，請(qǐng)參閱此處的 Python 代碼。腳本要求您擔(dān)任陪審團(tuán)，并包含一些預(yù)先包含在代碼中的 AI 生成（和人類生成）完整列表。該機(jī)制識(shí)別最適合陪審團(tuán)答案的完整列表的線性組合。在這種情況下，獲勝組合是 0.199 * Claude 的答案 + 0.801 * Deepseek 的答案；這個(gè)組合比任何單個(gè)模型都更符合陪審團(tuán)的答案。這些系數(shù)也將是給予提交者的獎(jiǎng)勵(lì)。

在這個(gè)“擊敗索倫”的例子中，“人類作為方向盤”的方面體現(xiàn)在兩個(gè)地方。首先，每個(gè)問(wèn)題都應(yīng)用了高質(zhì)量的人類判斷，盡管這仍然利用陪審團(tuán)作為“技術(shù)官僚”績(jī)效評(píng)估者。其次，有一個(gè)隱含的投票機(jī)制，決定“擊敗索倫”是否是正確的目標(biāo)（而不是，比如說(shuō)，試圖與索倫結(jié)盟，或?qū)⒛硹l關(guān)鍵河流以東的所有領(lǐng)土都交給他作為和平讓步）。還有其他蒸餾的人類判斷用例，其中陪審團(tuán)的任務(wù)更直接地帶有價(jià)值觀：例如，想象一個(gè)分散的社交媒體平臺(tái)（或子社區(qū)），陪審團(tuán)的工作是將隨機(jī)選擇的論壇帖子標(biāo)記為遵守或不遵守社區(qū)規(guī)則。

在蒸餾人類判斷范式中，存在一些開放變量：

如何進(jìn)行抽樣？完整名單提交者的作用是提供大量答案；陪審員的作用是提供高質(zhì)量的答案。我們需要以這樣的方式選擇陪審員，并為陪審員選擇問(wèn)題，即模型匹配陪審員答案的能力最大程度地表明其總體表現(xiàn)。一些考慮因素包括：

專業(yè)知識(shí)與偏見的權(quán)衡：熟練的陪審員通常專門從事其專業(yè)領(lǐng)域，因此讓他們選擇要評(píng)級(jí)的內(nèi)容，您將獲得更高質(zhì)量的輸入。另一方面，過(guò)多的選擇可能會(huì)導(dǎo)致偏見（陪審員偏愛(ài)與他們有聯(lián)系的人的內(nèi)容）或抽樣的弱點(diǎn)（某些內(nèi)容系統(tǒng)地未評(píng)級(jí)）

反古德哈特：將有內(nèi)容試圖“玩弄”人工智能機(jī)制，例如，貢獻(xiàn)者生成大量看起來(lái)令人印象深刻但無(wú)用的代碼。這意味著陪審團(tuán)可以檢測(cè)到這一點(diǎn)，但靜態(tài)人工智能模型除非他們努力嘗試，否則不會(huì)檢測(cè)到。捕捉這種行為的一種可能方法是添加一種挑戰(zhàn)機(jī)制，通過(guò)該機(jī)制，個(gè)人可以標(biāo)記此類嘗試，保證陪審團(tuán)對(duì)其進(jìn)行判斷（從而激勵(lì)人工智能開發(fā)人員確保正確捕捉它們）。如果陪審團(tuán)同意，舉報(bào)者將獲得獎(jiǎng)勵(lì)，如果陪審團(tuán)不同意，則要支付罰款。

您使用什么評(píng)分函數(shù)？當(dāng)前深度資助試點(diǎn)中使用的一個(gè)想法是詢問(wèn)陪審員“A 還是 B 應(yīng)該獲得更多的信用，以及多多少？”。評(píng)分函數(shù)為 score(x) = sum((log(x[B]) - log(x[A]) - log(juror_ratio)) ** 2 for (A, B, juror_ratio) in jury_answers)：也就是說(shuō)，對(duì)于每個(gè)陪審團(tuán)答案，它會(huì)詢問(wèn)完整列表中的比率與陪審員提供的比率有多遠(yuǎn)，并添加與距離平方成比例的懲罰（在對(duì)數(shù)空間中）。這是為了表明評(píng)分函數(shù)的設(shè)計(jì)空間很豐富，評(píng)分函數(shù)的選擇與您向陪審員提出哪些問(wèn)題的選擇有關(guān)。

您如何獎(jiǎng)勵(lì)完整列表提交者？理想情況下，您希望經(jīng)常給予多個(gè)參與者非零獎(jiǎng)勵(lì)，以避免壟斷機(jī)制，但您也希望滿足以下屬性：參與者不能通過(guò)多次提交相同（或略微修改）的答案集來(lái)增加獎(jiǎng)勵(lì)。一種有希望的方法是直接計(jì)算最適合陪審團(tuán)答案的完整列表的線性組合（系數(shù)非負(fù)且總和為 1），并使用這些相同的系數(shù)來(lái)分割獎(jiǎng)勵(lì)。也可能有其他方法。

總的來(lái)說(shuō)，目標(biāo)是采用已知有效、偏見最小化且經(jīng)受住了時(shí)間考驗(yàn)的人類判斷機(jī)制（例如，想象一下法院系統(tǒng)的對(duì)抗結(jié)構(gòu)如何包括爭(zhēng)議的兩方，他們擁有大量信息但有偏見，而法官擁有少量信息但可能沒(méi)有偏見），并使用開放的人工智能市場(chǎng)作為這些機(jī)制的合理高保真度和非常低成本的預(yù)測(cè)指標(biāo)（這類似于大預(yù)言模型“蒸餾”的工作方式）。

深度融資（deep funding）

深度融資是將人類蒸餾的判斷應(yīng)用于填寫“X 的信用有多少百分比屬于 Y？”圖上邊的權(quán)重問(wèn)題。

最簡(jiǎn)單的方法是直接用一個(gè)例子來(lái)說(shuō)明：

兩級(jí)深度融資示例的輸出：以太坊的思想起源。請(qǐng)?jiān)诖颂幉榭?Python 代碼。

這里的目標(biāo)是分配對(duì)以太坊的哲學(xué)貢獻(xiàn)的榮譽(yù)。讓我們看一個(gè)例子：

這里顯示的模擬深度融資輪次將 20.5% 的功勞歸于密碼朋克運(yùn)動(dòng)，將 9.2% 的功勞歸于技術(shù)進(jìn)步主義。

在每個(gè)節(jié)點(diǎn)中，您都會(huì)提出一個(gè)問(wèn)題：它在多大程度上是原創(chuàng)貢獻(xiàn)（因此它值得為自己贏得功勞），在多大程度上是其他上游影響的重新組合？對(duì)于密碼朋克運(yùn)動(dòng)，它有 40% 是新的，60% 是依賴項(xiàng)。

然后，您可以查看這些節(jié)點(diǎn)上游的影響：自由主義小政府主義和無(wú)政府主義為密碼朋克運(yùn)動(dòng)贏得了 17.3% 的功勞，但瑞士直接民主只獲得了 5%。

但請(qǐng)注意，自由主義小政府主義和無(wú)政府主義也啟發(fā)了比特幣的貨幣哲學(xué)，因此它通過(guò)兩種途徑影響了以太坊的哲學(xué)。

要計(jì)算自由主義小政府主義和無(wú)政府主義對(duì)以太坊的總貢獻(xiàn)份額，你需要將每條路徑上的邊相乘，然后將路徑相加：0.205 * 0.6 * 0.173 + 0.195 * 0.648 * 0.201 ~= 0.0466。因此，如果你必須捐贈(zèng) 100 美元來(lái)獎(jiǎng)勵(lì)所有為以太坊的哲學(xué)做出貢獻(xiàn)的人，根據(jù)這一模擬的深度融資輪，自由主義小政府主義者和無(wú)政府主義者將獲得 4.66 美元。

這種方法旨在適用于那些在以前的工作基礎(chǔ)上進(jìn)行工作且結(jié)構(gòu)高度清晰的領(lǐng)域。學(xué)術(shù)界（想想：引用圖）和開源軟件（想想：庫(kù)依賴關(guān)系和分叉）就是兩個(gè)自然的例子。

一個(gè)運(yùn)作良好的深度資助系統(tǒng)的目標(biāo)是創(chuàng)建和維護(hù)一個(gè)全局圖，任何有興趣支持某個(gè)特定項(xiàng)目的資助者都能夠?qū)①Y金發(fā)送到代表該節(jié)點(diǎn)的地址，資金將根據(jù)圖邊緣的權(quán)重自動(dòng)傳播到其依賴項(xiàng)（并遞歸到它們的依賴項(xiàng)等）。

你可以想象一個(gè)去中心化協(xié)議使用內(nèi)置深度融資裝置來(lái)發(fā)行其代幣：協(xié)議內(nèi)的去中心化治理將選擇一個(gè)陪審團(tuán)，陪審團(tuán)將運(yùn)行深度融資機(jī)制，因?yàn)閰f(xié)議會(huì)自動(dòng)發(fā)行代幣并將其存入與其自身對(duì)應(yīng)的節(jié)點(diǎn)。通過(guò)這樣做，協(xié)議以編程方式獎(jiǎng)勵(lì)其所有直接和間接貢獻(xiàn)者，讓人想起比特幣或以太坊區(qū)塊獎(jiǎng)勵(lì)如何獎(jiǎng)勵(lì)一種特定類型的貢獻(xiàn)者（礦工）。通過(guò)影響邊緣的權(quán)重，陪審團(tuán)可以不斷定義它重視的貢獻(xiàn)類型。這種機(jī)制可以作為挖礦、銷售或一次性空投的去中心化和長(zhǎng)期可持續(xù)的替代方案。

增加隱私

通常，要對(duì)上述示例中的問(wèn)題做出正確的判斷，需要能夠訪問(wèn)私人信息：組織的內(nèi)部聊天記錄、社區(qū)成員秘密提交的信息等。“僅使用單個(gè) AI”的一個(gè)好處，尤其是在規(guī)模較小的環(huán)境中，是讓一個(gè) AI 訪問(wèn)信息比向所有人公開信息更容易被接受。

為了在這些情況下使蒸餾的人類判斷或深度資助發(fā)揮作用，我們可以嘗試使用加密技術(shù)安全地讓 AI 訪問(wèn)私人信息。這個(gè)想法是使用多方計(jì)算 (MPC)、完全同態(tài)加密 (FHE)、可信執(zhí)行環(huán)境 (TEE) 或類似機(jī)制來(lái)提供私人信息，但僅限于其唯一輸出是直接放入機(jī)制中的“完整列表提交”的機(jī)制。

如果你這樣做，那么你就必須將機(jī)制集限制為 AI 模型（而不是人類或 AI + 人類組合，因?yàn)槟悴荒茏屓祟惪吹綌?shù)據(jù)），并且特定于在某些特定基底（例如 MPC、FHE、可信硬件）中運(yùn)行的模型。一個(gè)主要的研究方向是找出近期足夠有效、有意義的實(shí)用版本。

發(fā)動(dòng)機(jī)+方向盤設(shè)計(jì)的優(yōu)點(diǎn)

這樣的設(shè)計(jì)有許多令人期待的好處。迄今為止，最重要的好處是，它們?cè)试S構(gòu)建 DAO，讓人類選民控制方向，但他們不會(huì)被過(guò)多的決策所困擾。它們達(dá)到了折衷，每個(gè)人不必做出 N 個(gè)決定，但他們擁有的權(quán)力不僅僅是做出一個(gè)決定（委托通常如何運(yùn)作），而且更能引發(fā)難以直接表達(dá)的豐富偏好。

此外，這樣的機(jī)制似乎具有激勵(lì)平滑特性。我在這里所說(shuō)的“激勵(lì)平滑”是兩個(gè)因素的組合：

擴(kuò)散：投票機(jī)制采取的任何單一行動(dòng)都不會(huì)對(duì)任何單一參與者的利益產(chǎn)生過(guò)大影響。

混亂：投票決策與它們?nèi)绾斡绊憛⑴c者利益之間的聯(lián)系更加復(fù)雜且難以計(jì)算。

這里的混淆和擴(kuò)散這兩個(gè)術(shù)語(yǔ)取自密碼學(xué)，它們是密碼和哈希函數(shù)安全的關(guān)鍵屬性。

當(dāng)今現(xiàn)實(shí)世界中激勵(lì)平滑的一個(gè)很好的例子是法治：政府高層不會(huì)定期采取“給愛(ài)麗絲的公司 2 億美元”、“罰款鮑勃的公司 1 億美元”等形式的行動(dòng)，而是通過(guò)旨在均勻應(yīng)用于大量參與者的規(guī)則，然后由另一類參與者進(jìn)行解釋。當(dāng)這種方法奏效時(shí)，好處是它大大減少了賄賂和其他形式腐敗的好處。當(dāng)它被違反時(shí)（在實(shí)踐中經(jīng)常發(fā)生），這些問(wèn)題很快就會(huì)被大大放大。

AI顯然將成為未來(lái)的重要組成部分，這將不可避免地成為未來(lái)治理的重要組成部分。但是，如果你讓AI參與治理，這有明顯的風(fēng)險(xiǎn)：AI有偏見，它可能在訓(xùn)練過(guò)程中被故意破壞，而且AI技術(shù)發(fā)展如此之快，“讓AI掌權(quán)”可能實(shí)際上意味著“讓負(fù)責(zé)升級(jí)AI的人掌權(quán)”。蒸餾的人類判斷提供了一條前進(jìn)的替代道路，讓我們能夠以開放的自由市場(chǎng)方式利用AI的力量，同時(shí)保持人類控制的民主。

特別感謝 Devansh Mehta、Davide Crapis 和 Julian Zawistowski 的反饋和審查，以及 Tina Zhen、Shaw Walters 和其他人的討論。

上一篇：金色早報(bào)丨CZ發(fā)布代幣發(fā)行瘋狂想法白宮于3月7日舉行加密貨幣峰會(huì) 下一篇：香港會(huì)展管理公司：Consensus Hong Kong 2025及周邊活動(dòng)帶來(lái)2.75億港元經(jīng)濟(jì)效益

相關(guān)文章