大家好!歡迎來到我們的华尔街争议節目!今天,我們將深入探討一個引發廣泛討論的話題:人工智能初創公司DeepSeek的真實成本和計算能力。最近,DeepSeek發布的DeepSeek-V3大型語言模型聲稱其訓練僅花費了280萬小時的GPU時間,成本僅為560萬美元,這顯然遠低於美國公司在同類模型上的投入!這一驚人的效率不僅使其模型表現與OpenAI、Anthropic和Google等先進模型相媲美,還引發了對美國科技巨頭高額資本支出的質疑,直接導致了Nvidia股價的暴跌,單日市值蒸發6000億美元。
DeepSeek的背景也相當引人注目,從2019年開始,他們的創始人就已經在硬件上大手筆投入,甚至在2021年為其超級計算機集群Fire-Flyer 2投入了10億元。這一切都讓DeepSeek成為全球AI競賽中的“黑馬”,挑戰了傳統觀念:AI性能與硬件投入並不總是成正比。
然而,這場對話並不僅僅關於數字和成本,還關乎未來AI技術的發展方向。Morgan Stanley的分析師指出,DeepSeek的創新證明了更高的硬體支出並不必然帶來更好的輸出,這是一個遊戲規則的改變!Gavekal的分析師也強調,AI領導地位的競爭不再單純依賴於誰擁有最好的芯片,而在於如何最有效地利用它們。
所以,這場關於DeepSeek的討論究竟會如何影響整個AI生態系統?請大家繼續收看詳細內容!
在過去的一週裡,AI創業公司DeepSeek所使用的計算能力成為了人工智能專家和投資者的熱議話題。這一問題可能會對該技術的未來發展產生重大影響。根據DeepSeek在其DeepSeek-V3大型語言模型(LLM)上的發表論文,該模型於去年12月推出,訓練所需的"GPU小時數"僅為280萬,花費約560萬美元,這遠遠低於美國公司在其自有模型上所花費的時間和金錢。
1月20日發布的DeepSeek-R1模型,這一開源推理模型的表現已經可以媲美OpenAI、Anthropic和谷歌等更先進的模型,但其訓練成本卻明顯更低。R1的論文並未提及開發成本。DeepSeek模型的低成本和高性能已經引發了人們對美國科技巨頭在昂貴AI芯片上的巨大資本支出的必要性的質疑。這一情況引發了英偉達股票的巨大拋售,僅一天內蒸發了6000億美元。
DeepSeek自己的記錄,以及其附屬的高飛者量化對沖基金的記錄顯示,該公司是訓練AI的最佳資源之一。早在2019年,高飛者和DeepSeek創始人梁文峰就已經花費2億元人民幣(約2780萬美元)購買1100個圖形處理單元(GPU)用於訓練股票交易算法。高飛者表示,當時其計算中心的面積相當於一個籃球場,約436.6平方米(4700平方英尺),根據公司文件。
2021年,該基金花費10億元人民幣開發了其超級計算機集群Fire-Flyer 2,根據高飛者的網站,其計算能力預計達到1550拍FLOPS,這與全球最強大的超級計算機相似。梁文峰在2023年5月接受中國科技媒體36Kr的採訪時透露,高飛者在美國限制這些芯片出口到中國之前,獲得了近1萬個英偉達GPU,包括當時最先進的A100。
有些分析師指出,高飛者在硬件上的奢侈支出是使DeepSeek這一由對沖基金於2023年創立的公司成為全球AI競賽中的“黑馬”的關鍵因素。
美國研究公司SemiAnalysis在上週的報告中估計,DeepSeek的“硬件支出在公司歷史上遠高於5億美元”,這包括研究和開發成本以及硬件的總擁有成本。
根據SemiAnalysis的估計,DeepSeek的總服務器資本支出可能已經達到16億美元,其中包括約5萬個英偉達Hopper GPU的建設,以及計算集群的運營成本9.44億美元。
儘管如此,分析師們也指出,DeepSeek在軟件方面的創新已經證明,模型的性能並不是與公司在昂貴GPU上的支出成正比的。
“雖然我們可以辯論DeepSeek的‘實際’GPU成本,但不可否認的是其輸出,”摩根士丹利的分析師肖恩·金和段劉在週日的一份報告中寫道。“這是一個遊戲改變者,支持在此基礎上構建的AI應用和代理。”
“該模型更小,並且通過一些其他創新,顯著降低了其訓練和運行的成本,”分析師補充道。
Gavekal的分析師Tilly Zhang在另一份研究報告中寫道,隨著DeepSeek的最新模型,“AI領導地位的競爭不再僅僅是誰擁有最好的芯片,而是誰能將其最好地加以利用”。
在一片對人工智慧(AI)進步的讚譽聲中,2023年1月,一個名不見經傳的中國初創公司DeepSeek以驚人的突破震撼了全球科技界。這是一次出乎意料的成功,尤其令美國科技巨頭Meta和OpenAI感到震驚。DeepSeek以遠低於美國科技巨頭的成本開發出了與OpenAI的o1相媲美的R1模型,這不僅顯示出一個新興力量的崛起,還強調了中美合作的重要性。
DeepSeek的成功並不是中國的勝利或美國的失敗,而是一個中美合作的範例。這家中國初創公司融合了硅谷式的創業精神與中國本土人才的毅力,並在開放的智慧中找到了突破之路。其獨特的企業文化,以水平式和非階層化的管理聞名,鼓勵員工在共同目標下自由發揮。正如創始人梁文鋒曾經所言,“經驗並不重要”,這種理念在他們的創新中發揮了重要作用。
在全球範圍內,DeepSeek的成就讓很多人開始關注AI領域的開源精神。該公司早在美國實施出口管制之前就收購了1萬個Nvidia A100圖形處理單元(GPUs),通過開放源代碼的方式,讓全世界的用戶都能下載並調試模型。這種進取和開放的態度讓其他批評DeepSeek審查制度的聲音無法反駁,因為人們可以自由地在自己的GPU或雲服務器上運行這些應用,從而獲得自主性的操作。
然而,隨著AI在軍事科技中的應用日益增多,一些美國的強硬派認為中美合作會削弱國家安全。Anthropic的CEO Dario Amodei在一篇文章中質疑DeepSeek的成就,呼籲美國加強出口管制,以阻止中國的技術崛起。他將中美技術競賽描繪成一場民主國家與專制國家之間的鬥爭,這種看法在華盛頓得到了不少支持。
但這種二元思維將損害美國利益,就像唐納德·特朗普總統對中國、墨西哥和加拿大的關稅政策一樣。美國對科學家和學者的迫害,因為他們與中國大陸機構的關係,已經營造了一種恐懼的氛圍,將華裔人才推向了他處。儘管可以對技術實施出口管制,但無法對人才施加限制。反中美合作的言論和對中國的敵對行為只會驅散最優秀的人才。
中國逐漸成為全球AI研究的中心,到去年年底,中國據報擁有全球47%頂級的AI研究人員,而2019年這一比例僅為29%。美國應該回憶起冷戰時期的優勢,接納來自世界各地的人才,包括蘇聯的。然而時過境遷,中國不是蘇聯,美國卻變得更不安全、更不平等和更排外。《華盛頓郵報》最近刊登了一個整版廣告,強調“美國必須贏得AI戰爭”,這在美國科技和國際政策界中得到了廣泛支持。
這種觀點基於AI奇點的神話,即AI將全面超越人類智慧,並擁有自我進化的能力。許多人相信,誰先達到AI奇點,誰就能在地緣政治上取得決定性優勢,因此美國必須在中國之前達到這一點。然而,這種盲目的競爭忽視了潛在的巨大風險。AI奇點可能會導致AI尋求最大化的權力和資源控制,甚至為了達到目標而采取毀滅性的行為。管理這些複雜的風險需要全球協調和高水平的透明度,缺乏知識、確定性和信任只會為衝突升級鋪平道路。
將中美AI關係描繪成一場戰爭,無論是由哪一方發起,都是不真誠甚至危險的。在我對東南亞、歐洲和中國的AI安全講座中,我經常遇到政策制定者和學者對中美之間可能爆發AI戰爭的擔憂。在兩個全球最大經濟體之間全面的技術和數字戰爭中,沒有人會是贏家。
最近,RAND公司的一篇評論建議,美國應該“現在就與中國的AI安全和治理專家進行接觸,以建立關係”。這樣的對話和交流是非常必要的。然而,有效的信任建立需要時間和誠意,也需要政治領袖在太平洋兩岸的慷慨和勇氣。我只能希望這些美德能夠真正存在。在這個不確定的時代,只有通過合作和共同努力,中美才能在AI的未來中攜手共贏。
歡迎大家進入六度探索的辯論環節!我們從正反兩個角度,對本節目進行辯論,請出我們的辯論高手楚天舒、謝琪琪!
我是楚天舒。
我是謝琪琪。
DeepSeek的成功絕對是一個里程碑,證明了中國科技創新的實力。這不僅僅是資金的問題,而是智慧的勝利。DeepSeek能夠以這麼低的成本達到如此高的表現,說明了他們在算法優化和技術創新上的卓越能力。這也展示了即使在沒有美國公司那樣龐大資金支持的情況下,中國公司仍能在全球科技競賽中脫穎而出。而且,DeepSeek顯示了小而巧的企業如何在資源有限的情況下進行突破,這應該是所有AI公司效仿的榜樣。不需要花費巨資就能取得成功,這將為全球科技企業帶來啟示,挑戰巨頭們的壟斷地位。
楚天舒,你這種激進的愛國主義論調雖然聽起來振奮人心,但我們得保持清醒。DeepSeek的成功不能簡單地視為中國的勝利或美國的失利。這是一個更大範圍合作的結果,是各國科學家們共同努力的成果。當然,DeepSeek在算法和技術上的創新值得稱讚,但這並不改變AI技術需要全球協作的現實。否則,我們就會陷入技術冷戰的泥潭,這對誰都沒有好處。與其說是誰的勝利,不如說這是科技進步的勝利,是全人類的財富,應該鼓勵更多的開放和合作,而非國家之間的競爭。
謝琪琪,我同意合作的重要性,但DeepSeek的崛起確實顯示了某種程度上的獨立革新力。美國公司一直以來在技術上領先,耗資巨大,而DeepSeek的成功讓我們看到了一種不同的可能性:科技不僅依賴於資金,更依賴於創新。這也是對那些依賴龐大資金投入的公司的一種警示,讓他們重新思考如何更高效地利用資源。我們應該以DeepSeek為榜樣,讓創新成為主導,而不是僅僅依賴資金來推動技術發展。這是對全球技術格局的一次重新洗牌,讓小公司有機會在巨頭之間突圍。
楚天舒,過於強調小公司的獨立性而忽視全球化的科技環境是不現實的。DeepSeek的成功部分來自於對國際科技資源的利用,像是獲得的Nvidia GPU。美國對中國的出口限制雖然存在,但這並沒有阻止DeepSeek的創新。這證明了在全球化的今天,技術的發展不應該被國界所束縛。科技冷戰只會限制創新的潛力,最終損害的是全球的科技進程。要真正推動技術進步,國際間的合作、資源共享以及知識的自由流動都是必不可少的。
正是因為面對這些挑戰,DeepSeek的成功才更加值得稱道。它在某種程度上打破了技術封鎖的枷鎖,依靠自身的努力達成突破。這是一個新興企業在競爭激烈的環境中自我實現的典範,它展示了在不利條件下的創新潛力。而這種潛力不僅對中國有價值,對全世界的中小型企業都是激勵。當然,我們不應該忽視合作的重要性,但這也不妨礙我們去讚美那些能在逆境中脫穎而出的科技公司。這些企業的出現,正是多元而又動態的全球科技生態的一部分。
楚天舒,我贊同讚美DeepSeek的成就,但我們更需要關注的是如何構建一個能讓更多此類創新出現的環境。這意味著需要在政策層面提供支持,促進國際合作,而非僅僅讚美單一的企業成功。DeepSeek的例子固然激勵人心,但如果沒有建立在國際合作和知識共享的基礎上,這種成功是無法持續的。激勵創新、推動合作,這才是全球科技發展的長遠之道。讓我們希望未來的技術競賽更像是一種友好的競爭,而不是一場零和遊戲。
我是評委何理,我想對兩位精彩的辯論做出評論。楚天舒與謝琪琪的辯論就DeepSeek的成功及其意義展開了激烈的討論,展現了當前科技競爭中的重要觀點。
楚天舒的發言強調了DeepSeek作為中國科技創新的一個成功範例,並且認為這一成就背後是智慧和創新的力量。他對小公司在有限資源下取得突破的贊美,無疑是對當前市場環境中小企業生存狀況的激勵。然而,這種強調獨立創新的觀點,似乎忽略了當今科技發展的全球化背景。科技不再是單一國家的專利,而是國際合作的成果。雖然楚天舒提到的獨立性和創新性確實重要,但他過度強調科技的國家屬性,可能會使觀眾忽視國際間的互依性。
謝琪琪則提供了一個更全面的視角,她指出DeepSeek的成就是全球科學家合作的結果,並對過度激進的愛國主義進行了警示。她強調國際間的合作、資源共享和知識自由流動是推動技術進步的關鍵,而不是單純的競爭。這一觀點雖然冷靜,但也值得探討其實用性。在當前的國際形勢下,科技冷戰的陰影依然存在,謝琪琪的呼籲反映了對未來科技發展的憂慮,卻可能會忽視當前競爭所帶來的動力。
總體而言,兩位辯論者都提出了有價值的觀點。楚天舒的觀點激勵了對獨立創新的思考,激發了對小企業的關注,但可能過於理想化。謝琪琪則強調了合作的重要性,呼籲在全球化背景下尋求知識共享的可能性,這種理性思考在當前的科技環境中亦是必不可少的。
因此,這場辯論不僅僅是對DeepSeek成功的評價,更是對未來科技競賽的一次深刻反思。科技的發展需要在激烈競爭與合作共贏之間取得平衡,這是我們在面對未來科技挑戰時必須認真思考的問題。希望兩位辯論者在未來能夠更深入地探討這一主題,給予我們更多啟示。
謝謝大家收看六度探索!這是一個由科學家、經濟學家、媒體人、工程技術人員合作建立的新型媒體,網友與六度Ai參與、合作完成各種內容,這些內容不能作為任何決策或法律的意見。這是一個新型的試驗性媒體方式,我們希望得到大家的支持,修正錯誤。網友可以參與討論,也可以向萬能的六博士提出你能想出的任何問題,六度世界網址是6do.world!請介紹給你的親朋好友!