DeepSeek暴擊英偉達震驚特朗普

訪客 2個月前 (01-28) 閱讀數(shù) 170 #區(qū)塊鏈

文章標簽前沿文章

作者：秦晉；來源：碳鏈價值

讓硅谷大佬和華爾街精英們?nèi)f萬沒想到的是，一股來自東方的神秘力量DeepSeek居然能讓美國股市及其巨額財富在一夜之間實現(xiàn)史詩級下跌和縮水。1月28日，據(jù)相關數(shù)據(jù)顯示，美股芯片股一夜之間蒸發(fā)掉1萬億美元。英偉達市值單日蒸發(fā)掉6000億美元，創(chuàng)美股最高記錄。就連美國總統(tǒng)特朗普也按奈不住出來發(fā)表一番評論。他表示，中國人工智能應用DeepSeek的突然崛起「應該給美國科技公司敲響警鐘」，并表示中國公司開發(fā)出更便宜、更高效的人工智能模型是件好事。

特朗普表示，他仍然預計美國科技公司將在人工智能領域占據(jù)主導地位，但他承認低成本人工智能助手DeepSeek帶來的挑戰(zhàn)。DeepSeek在過去的周末飆升至蘋果應用商店第一名。

接下來的問題是，這僅僅是開始嗎？

1月28日，據(jù)英國《金融時報》報道，一家鮮為人知的中國對沖基金向人工智能領域投擲一枚重磅炸彈。他們開發(fā)的人工智能大模型實際上與市場領導者Sam Altman的OpenAI旗鼓相當，但成本卻只有后者的零頭。OpenAI將其模型的工作原理視為專有技術，而DeepSeek的R1則將技術核心進行開源，從而吸引了開發(fā)人員使用和在此基礎上進行開發(fā)。

在周一美國股市開盤前，人工智能領域最大的5家科技股——英偉達、Alphabet、亞馬遜、微軟以及Meta Platforms——市值合計蒸發(fā)近7500億美元。如果DeepSeek真的在沒有使用其最先進芯片的情況下獲勝，那么對英偉達來說可能尤其嚴峻。

而在美股開盤后：芯片股英偉達跌幅高達17.5%。博通跌幅高達達16.5%。臺積電跌幅達14.3%。美光跌幅達10.5%。Arm跌幅達 10.0%。AMD跌幅達5.6%。上述芯片股在一天內(nèi)就跌去近 1 萬億美元市值。其中英偉達已經(jīng)跌去自10月2日以來的所有漲幅，在兩個交易日內(nèi)下跌21%。英偉達市值已下跌6300 億美元。這是上周世界上最大的上市公司，在兩天內(nèi)跌去五分之一價值。黃仁勛個人身價也隨之縮水1000億美元。

包括芯片制造商ASML在內(nèi)的科技公司和能源公司的投資者原本希望數(shù)據(jù)中心的發(fā)展能夠推動公司業(yè)績增長，現(xiàn)在卻擔心自己的投資會付諸東流。根據(jù)Visible Alpha估計，超大型公司今年將投入近3000億美元用于資本支出。分析師預計，在周三公布財報時，Meta和微軟將報告2024年的投資總額為940億美元。

有外媒分析表示，人工智能競賽已經(jīng)開始。讓英偉達股價崩潰的原因顯然包括，DeepSeek已成為人工智能創(chuàng)新的領導者，英偉達稱其為「卓越的人工智能進步」。

其次，從理論上講，人工智能進步對英偉達來說是利好，因為這意味著更多的芯片需求。問題是DeepSeek在中國，而美國正在對中國進行芯片技術封鎖。這意味著英偉達只能向DeepSeek大量出售性能較弱的H800芯片，而不能出售每顆售價超過3萬美元的H100芯片。即使DeepSeek只持有性能較低的芯片，中國也能有效地生成一種成本降低96%且效率更高的AI模型，價格也降低了90%以上。

同時，他們的AI模型是免費的，而像ChatGPT這樣的AI模型相對昂貴（每月200美元以上），效率也較低。看來中國已經(jīng)開始以以前認為不可能的速度進行創(chuàng)新。美國科技界認為其主導地位無法被取代。美國的大盤科技股現(xiàn)在正面臨現(xiàn)實，他們可以免費獲得更好的AI模型，而且只會越來越好。為什么要為更差的產(chǎn)品支付溢價呢？

接下來的反應可能是美國限制DeepSeek或向中國出口芯片（我們已經(jīng)看到幾個月了），但這顯然行不通。如果英偉達能夠找到一種方法來利用DeepSeek的發(fā)展帶來的新需求，那么這次下跌將被視為一種禮物。最終，人工智能在硬件和軟件方面的競爭將加劇，沒有公司會是「安全的」，創(chuàng)新的速度只會加快。

那么DeepSeek取勝是原因是什么？以及未來人工智能會如何展開？

美國投資公司Atreides管理合伙人Gavin Baker從多個維度對DeepSeek以及人工智能未來演進趨勢進行了分析。馬斯克稱贊這是自己見過的最好的分析。

Gavin Baker表示，最重要的是，DeepSeek R1比Open ai o1便宜得多，推理效率也更高，這不是從600萬美元的訓練數(shù)據(jù)中得出的。R1在每個API上的使用成本比o1低93%，可以在本地高端工作站上運行，似乎沒有達到任何瘋狂的速率限制。簡單的數(shù)學計算表明，在FP8中，每個1b的活動參數(shù)需要1gb的RAM，因此R1需要37gb的RAM。批量處理可以大大降低成本，而更多的計算可以增加每秒的token數(shù)，因此在云中進行推理仍然具有優(yōu)勢。還要注意的是，這里的確存在地緣政治動態(tài)作用，我認為這并非巧合，因為這是在《星際之門》之后出現(xiàn)的。5000億美元——我們甚至幾乎不認識你。

DeepSeek是/曾是App Store相關類別中的下載量第一。顯然領先于ChatGPT；這是Gemini和Claude都無法做到的事情。2）從質(zhì)量角度來看，它與o1相當，盡管落后于o3。3）算法方面確實取得了突破，使得訓練和推理效率大大提高。FP8、MLA和多標記預測的訓練非常重要。4）很容易驗證r1訓練運行只花費了600萬美元。雖然這是事實，但它也深深地誤導了人們。5）即使他們的硬件架構也很新穎，我會注意到他們使用PCI-Express進行擴展。

細微差別：1）根據(jù)技術論文，600萬美元不包括「與之前對架構、算法和數(shù)據(jù)的研究和消融實驗相關的成本」。這意味著，如果實驗室已經(jīng)花費了數(shù)億美元進行前期研究，并且可以使用更大的集群，那么用600萬美元的運行成本訓練一個r1質(zhì)量的模型是可能的。Deepseek顯然擁有超過2048個H800；他們早期的一篇論文提到過1萬個A100組成的集群。一個同樣聰明的團隊不可能只用600萬美元就組建一個2000個GPU的集群，并從頭開始訓練r1。大約20%的英偉達收入來自新加坡。盡管Nvidia公司竭盡全力，但該公司20%的GPU可能并未在新加坡。2）他們進行了大量提煉工作——也就是說，如果沒有不受限制地訪問GPT-4o和o1，他們不太可能訓練出這個模型。正如@altcap昨天向我指出，限制使用領先的GPU，卻不采取任何措施應對中國提煉美國領先模型的能力，這有點滑稽——這顯然違背了出口限制的目的。既然可以免費獲得牛奶，為什么還要買奶牛呢？

結論：1）降低訓練成本將提高人工智能的投資回報率。2）短期內(nèi)，這對訓練資本支出或「電力」主題沒有積極意義。3）對于當前在科技、工業(yè)、公用事業(yè)和能源領域「人工智能基礎設施」的贏家來說，最大的風險是r1的精簡版本可以在高端工作站的邊緣本地運行（有人提到了Mac Studio Pro）。這意味著類似模型將在大約兩年內(nèi)在超級手機上運行。如果推理轉移到邊緣，因為它是「足夠好」，我們生活在一個非常不同的世界，贏家也完全不同——即我們所見過的最大的PC和智能手機升級周期。計算在中心化和去中心化之間搖擺了很長時間。4）ASI真的非常接近，沒有人真正知道超級智能的經(jīng)濟回報是什么。如果一個基于10萬多個Blackwells（o5、Gemini 3、Grok 4）訓練的1000億美元推理模型能夠治愈癌癥并發(fā)明曲速引擎，那么ASI的回報率將非常高，訓練成本支出和功耗將穩(wěn)步增長；戴森球（通常指圍繞恒星形成連續(xù)外殼的固體結構）將重新成為費米悖論的最佳解釋。我希望ASI的回報率很高——那真是太棒了。5）這對那些使用人工智能的公司來說確實是一件好事：軟件、互聯(lián)網(wǎng)等。6) 從經(jīng)濟角度來看，這極大地提高了分銷和獨特數(shù)據(jù)的價值——YouTube、Facebook、Instagram和X。7) 美國實驗室可能會停止發(fā)布其領先模型，以防止r1中必不可少的提煉過程，盡管在這方面可能已經(jīng)完全暴露了。即r1可能足以訓練r2等。

Grok-3即將問世，可能會對上述結論產(chǎn)生重大影響。這可以說是自 GPT-4 以來對預訓練規(guī)模法則的首次重大考驗。就像通過強化學習將v3變成r1需要幾周時間一樣，提高Grok-3推理能力所需的強化學習可能也需要幾周時間。基礎模型越好，推理模型應該越好，因為三個縮放定律是乘積的——預訓練、后訓練期間的強化學習和推理期間的測試時間計算（強化學習的函數(shù)）。Grok-3已經(jīng)證明它能夠完成超越o1的任務——參見Tesseract演示——超越的程度有多高將非常重要。套用《雙塔奇兵》中一位無名獸人的話來說，也許很快就能重新吃上肉了。時間會證明一切，「事實勝于雄辯，我會改變主意。」

不過美股投資分析師徐老貓認為，周一由于DeepSeek造成的拋售是一種過度反應。AI長期增長敘事仍然完好無損，而且可以說現(xiàn)在比以往任何時候都更強大。經(jīng)濟學中有個杰文斯悖論，認為資源利用效率的提高往往會增加(而不是減少)該資源的總體消耗，因為更高的效率會降低使用資源的成本，從而導致對資源的需求增加。

這發(fā)生在蒸汽機的煤炭使用上。蒸汽機效率的提高降低了單位產(chǎn)出的煤炭消耗。然而也使燃煤技術更具經(jīng)濟吸引力，導致更廣泛的采用，最終增加了總體煤炭消耗。這發(fā)生在互聯(lián)網(wǎng)上，隨著計算機越來越小和便宜，上網(wǎng)基本免費，人人都有電腦，人人全天候接入互聯(lián)網(wǎng)。

現(xiàn)在AI也如此。隨著AI模型訓練和推理成本的大幅下降，越來越多的公司和個人會構建自己的AI模型，AI在全球范圍內(nèi)普及滲透到社會方方面面。

上一篇：Uniswap CEO：一直考慮通過一次性ETH通脹收購頂級DeFi項目和L2，但似乎不太可能實現(xiàn) 下一篇：不丹王國政府已將495.43枚ETH轉移至新建BitGo多簽錢包

DeepSeek暴擊英偉達 震驚特朗普

DeepSeek暴擊英偉達震驚特朗普