DeepSeek暴擊英偉達 震驚特朗普

訪客 2個月前 (01-28) 閱讀數(shù) 170 #區(qū)塊鏈
文章標簽 前沿文章

作者:秦晉;來源:碳鏈價值

讓硅谷大佬和華爾街精英們?nèi)f萬沒想到的是,一股來自東方的神秘力量DeepSeek居然能讓美國股市及其巨額財富在一夜之間實現(xiàn)史詩級下跌和縮水。1月28日,據(jù)相關數(shù)據(jù)顯示,美股芯片股一夜之間蒸發(fā)掉1萬億美元。英偉達市值單日蒸發(fā)掉6000億美元,創(chuàng)美股最高記錄。就連美國總統(tǒng)特朗普也按奈不住出來發(fā)表一番評論。他表示,中國人工智能應用DeepSeek的突然崛起「應該給美國科技公司敲響警鐘」,并表示中國公司開發(fā)出更便宜、更高效的人工智能模型是件好事。

特朗普表示,他仍然預計美國科技公司將在人工智能領域占據(jù)主導地位,但他承認低成本人工智能助手DeepSeek帶來的挑戰(zhàn)。DeepSeek在過去的周末飆升至蘋果應用商店第一名。

接下來的問題是,這僅僅是開始嗎?

1月28日,據(jù)英國《金融時報》報道,一家鮮為人知的中國對沖基金向人工智能領域投擲一枚重磅炸彈。他們開發(fā)的人工智能大模型實際上與市場領導者Sam Altman的OpenAI旗鼓相當,但成本卻只有后者的零頭。OpenAI將其模型的工作原理視為專有技術,而DeepSeek的R1則將技術核心進行開源,從而吸引了開發(fā)人員使用和在此基礎上進行開發(fā)。

在周一美國股市開盤前,人工智能領域最大的5家科技股——英偉達、Alphabet、亞馬遜、微軟以及Meta Platforms——市值合計蒸發(fā)近7500億美元。如果DeepSeek真的在沒有使用其最先進芯片的情況下獲勝,那么對英偉達來說可能尤其嚴峻。

而在美股開盤后:芯片股英偉達跌幅高達17.5%。博通跌幅高達達16.5%。臺積電跌幅達14.3%。美光跌幅達10.5%。Arm跌幅達 10.0%。AMD跌幅達5.6%。上述芯片股在一天內(nèi)就跌去近 1 萬億美元市值。其中英偉達已經(jīng)跌去自10月2日以來的所有漲幅,在兩個交易日內(nèi)下跌21%。英偉達市值已下跌6300 億美元。這是上周世界上最大的上市公司,在兩天內(nèi)跌去五分之一價值。黃仁勛個人身價也隨之縮水1000億美元。

包括芯片制造商ASML在內(nèi)的科技公司和能源公司的投資者原本希望數(shù)據(jù)中心的發(fā)展能夠推動公司業(yè)績增長,現(xiàn)在卻擔心自己的投資會付諸東流。根據(jù)Visible Alpha估計,超大型公司今年將投入近3000億美元用于資本支出。分析師預計,在周三公布財報時,Meta和微軟將報告2024年的投資總額為940億美元。

有外媒分析表示,人工智能競賽已經(jīng)開始。讓英偉達股價崩潰的原因顯然包括,DeepSeek已成為人工智能創(chuàng)新的領導者,英偉達稱其為「卓越的人工智能進步」。

其次,從理論上講,人工智能進步對英偉達來說是利好,因為這意味著更多的芯片需求。問題是DeepSeek在中國,而美國正在對中國進行芯片技術封鎖。這意味著英偉達只能向DeepSeek大量出售性能較弱的H800芯片,而不能出售每顆售價超過3萬美元的H100芯片。即使DeepSeek只持有性能較低的芯片,中國也能有效地生成一種成本降低96%且效率更高的AI模型,價格也降低了90%以上。

同時,他們的AI模型是免費的,而像ChatGPT這樣的AI模型相對昂貴(每月200美元以上),效率也較低。看來中國已經(jīng)開始以以前認為不可能的速度進行創(chuàng)新。美國科技界認為其主導地位無法被取代。美國的大盤科技股現(xiàn)在正面臨現(xiàn)實,他們可以免費獲得更好的AI模型,而且只會越來越好。為什么要為更差的產(chǎn)品支付溢價呢?

接下來的反應可能是美國限制DeepSeek或向中國出口芯片(我們已經(jīng)看到幾個月了),但這顯然行不通。如果英偉達能夠找到一種方法來利用DeepSeek的發(fā)展帶來的新需求,那么這次下跌將被視為一種禮物。最終,人工智能在硬件和軟件方面的競爭將加劇,沒有公司會是「安全的」,創(chuàng)新的速度只會加快。

那么DeepSeek取勝是原因是什么?以及未來人工智能會如何展開?

美國投資公司Atreides管理合伙人Gavin Baker從多個維度對DeepSeek以及人工智能未來演進趨勢進行了分析。馬斯克稱贊這是自己見過的最好的分析。

Gavin Baker表示,最重要的是,DeepSeek R1比Open ai o1便宜得多,推理效率也更高,這不是從600萬美元的訓練數(shù)據(jù)中得出的。R1在每個API上的使用成本比o1低93%,可以在本地高端工作站上運行,似乎沒有達到任何瘋狂的速率限制。簡單的數(shù)學計算表明,在FP8中,每個1b的活動參數(shù)需要1gb的RAM,因此R1需要37gb的RAM。批量處理可以大大降低成本,而更多的計算可以增加每秒的token數(shù),因此在云中進行推理仍然具有優(yōu)勢。還要注意的是,這里的確存在地緣政治動態(tài)作用,我認為這并非巧合,因為這是在《星際之門》之后出現(xiàn)的。5000億美元——我們甚至幾乎不認識你。

DeepSeek是/曾是App Store相關類別中的下載量第一。顯然領先于ChatGPT;這是Gemini和Claude都無法做到的事情。2)從質(zhì)量角度來看,它與o1相當,盡管落后于o3。3)算法方面確實取得了突破,使得訓練和推理效率大大提高。FP8、MLA和多標記預測的訓練非常重要。4)很容易驗證r1訓練運行只花費了600萬美元。雖然這是事實,但它也深深地誤導了人們。5)即使他們的硬件架構也很新穎,我會注意到他們使用PCI-Express進行擴展。

細微差別:1)根據(jù)技術論文,600萬美元不包括「與之前對架構、算法和數(shù)據(jù)的研究和消融實驗相關的成本」。這意味著,如果實驗室已經(jīng)花費了數(shù)億美元進行前期研究,并且可以使用更大的集群,那么用600萬美元的運行成本訓練一個r1質(zhì)量的模型是可能的。Deepseek顯然擁有超過2048個H800;他們早期的一篇論文提到過1萬個A100組成的集群。一個同樣聰明的團隊不可能只用600萬美元就組建一個2000個GPU的集群,并從頭開始訓練r1。大約20%的英偉達收入來自新加坡。盡管Nvidia公司竭盡全力,但該公司20%的GPU可能并未在新加坡。2)他們進行了大量提煉工作——也就是說,如果沒有不受限制地訪問GPT-4o和o1,他們不太可能訓練出這個模型。正如@altcap昨天向我指出,限制使用領先的GPU,卻不采取任何措施應對中國提煉美國領先模型的能力,這有點滑稽——這顯然違背了出口限制的目的。既然可以免費獲得牛奶,為什么還要買奶牛呢?

結論:1)降低訓練成本將提高人工智能的投資回報率。2)短期內(nèi),這對訓練資本支出或「電力」主題沒有積極意義。3)對于當前在科技、工業(yè)、公用事業(yè)和能源領域「人工智能基礎設施」的贏家來說,最大的風險是r1的精簡版本可以在高端工作站的邊緣本地運行(有人提到了Mac Studio Pro)。這意味著類似模型將在大約兩年內(nèi)在超級手機上運行。如果推理轉移到邊緣,因為它是「足夠好」,我們生活在一個非常不同的世界,贏家也完全不同——即我們所見過的最大的PC和智能手機升級周期。計算在中心化和去中心化之間搖擺了很長時間。4)ASI真的非常接近,沒有人真正知道超級智能的經(jīng)濟回報是什么。如果一個基于10萬多個Blackwells(o5、Gemini 3、Grok 4)訓練的1000億美元推理模型能夠治愈癌癥并發(fā)明曲速引擎,那么ASI的回報率將非常高,訓練成本支出和功耗將穩(wěn)步增長;戴森球(通常指圍繞恒星形成連續(xù)外殼的固體結構)將重新成為費米悖論的最佳解釋。我希望ASI的回報率很高——那真是太棒了。5)這對那些使用人工智能的公司來說確實是一件好事:軟件、互聯(lián)網(wǎng)等。6) 從經(jīng)濟角度來看,這極大地提高了分銷和獨特數(shù)據(jù)的價值——YouTube、Facebook、Instagram和X。7) 美國實驗室可能會停止發(fā)布其領先模型,以防止r1中必不可少的提煉過程,盡管在這方面可能已經(jīng)完全暴露了。即r1可能足以訓練r2等。

Grok-3即將問世,可能會對上述結論產(chǎn)生重大影響。這可以說是自 GPT-4 以來對預訓練規(guī)模法則的首次重大考驗。就像通過強化學習將v3變成r1需要幾周時間一樣,提高Grok-3推理能力所需的強化學習可能也需要幾周時間。基礎模型越好,推理模型應該越好,因為三個縮放定律是乘積的——預訓練、后訓練期間的強化學習和推理期間的測試時間計算(強化學習的函數(shù))。Grok-3已經(jīng)證明它能夠完成超越o1的任務——參見Tesseract演示——超越的程度有多高將非常重要。套用《雙塔奇兵》中一位無名獸人的話來說,也許很快就能重新吃上肉了。時間會證明一切,「事實勝于雄辯,我會改變主意。」

不過美股投資分析師徐老貓認為,周一由于DeepSeek造成的拋售是一種過度反應。AI長期增長敘事仍然完好無損,而且可以說現(xiàn)在比以往任何時候都更強大。經(jīng)濟學中有個杰文斯悖論,認為資源利用效率的提高往往會增加(而不是減少)該資源的總體消耗,因為更高的效率會降低使用資源的成本,從而導致對資源的需求增加。

這發(fā)生在蒸汽機的煤炭使用上。蒸汽機效率的提高降低了單位產(chǎn)出的煤炭消耗。然而也使燃煤技術更具經(jīng)濟吸引力,導致更廣泛的采用,最終增加了總體煤炭消耗。這發(fā)生在互聯(lián)網(wǎng)上,隨著計算機越來越小和便宜,上網(wǎng)基本免費,人人都有電腦,人人全天候接入互聯(lián)網(wǎng)。

現(xiàn)在AI也如此。隨著AI模型訓練和推理成本的大幅下降,越來越多的公司和個人會構建自己的AI模型,AI在全球范圍內(nèi)普及滲透到社會方方面面。

熱門
主站蜘蛛池模板: 又大又硬又爽免费视频| 国内自产少妇自拍区免费| 久久精品中文字幕大胸| 欧美精欧美乱码一二三四区| 午夜爽爽爽男女免费观看影院| 高清一级淫片a级中文字幕| 国产精品吹潮香蕉在线观看| av无码免费看| 年轻帅主玩奴30min视频 | 国产麻豆一精品一av一免费| 一女多男np疯狂伦交| 日本xxx网站| 久久精品国产只有精品66| 欧美乱子欧美猛男做受视频伦xxxx96| 亚洲精品自在线拍| 疯狂三人交性欧美| 午夜爱爱免费视频| 色播亚洲视频在线观看| 国产在线视频区| 欧美乱妇高清无乱码亚洲欧美| 国产精品视频九九九| 99久久精品日本一区二区免费| 娇妻之欲海泛舟白丽交换| 中文全彩漫画爆乳| 无码国产色欲XXXXX视频| 国产一级生活片| 国产成人精品日本亚洲专区6| 孩交精品xxxx视频视频| 中文字幕日韩丝袜一区| 日韩一区在线视频| 乱中年女人伦av一区二区| 欧美人与动zooz| 亚洲欧美中文日韩v在线观看| 波霸影院一区二区| 人妻少妇精品中文字幕av蜜桃| 粗壮挺进邻居人妻| 又黄又爽又色的视频| 美女把腿扒开让男人桶爽了| 国产一级一国产一级毛片| 青草青视频在线观看| 国产又爽又黄又无遮挡的激情视频|