華盛頓郵報:中國人工智慧新星DeepSeek的成長並非依靠極低的預算:六度解析20250201

大家好!歡迎來到我們的六度解析節目!今天,我們要深入探討的主題是中國人工智慧新星 DeepSeek 的驚人崛起,這家公司竟然在美國政府的出口禁令之前,成功獲得了關鍵的 Nvidia 晶片,並以相對低廉的成本開發出強勁的聊天機器人,讓市場震驚不已。

DeepSeek 的母公司 High-Flyer 自 2015 年以來,一直在推動人工智慧的進步,並聲稱其最新模型的開發成本僅為 560 萬美元,這一驚人的數字引起了業界的質疑。與此同時,英偉達的市值因 DeepSeek 的崛起而蒸發了5850億美元,這無疑是對美國科技企業的一次重大打擊。

這家公司的成功背後,是否藏有不為人知的商業秘密?專家們正在調查 DeepSeek 是否透過第三方渠道獲得了最新的晶片,而其背後的龐大資金投入和運算能力又是如何驅動其迅速成長的?即便面對美國的嚴格出口管制,DeepSeek 似乎依然能夠利用中國強大的人工智慧生態系統和研究資源,快速崛起。

隨著 DeepSeek 在全球市場中的影響力不斷增強,這家公司將如何挑戰現有的競爭格局?他們的價格策略和技術實力是否會引發一場新一輪的市場競爭?這些問題都值得我們深入探討。

請大家繼續收看詳細內容!

DeepSeek:中國AI新星的崛起與謎團

來源:華盛頓郵報 (The Washington Post) 作者:Eva Dou, Katrina Northrop, 李麗娟, Gerrit De Vynck

DeepSeek,這個名字近日在矽谷和華爾街掀起軒然大波,其聊天機器人的橫空出世,導致股市蒸發萬億美元,也讓美國政府如坐針氈。而這一切,源於一個看似簡單卻充滿矛盾的數字:560萬美元。DeepSeek宣稱,正是憑藉這區區560萬美元的計算成本,以及約2000塊相對落後的Nvidia H800晶片,訓練出了其令人驚豔的最新模型。這與美國競爭對手動輒上億美元的投入形成鮮明對比,也因此引發了關於成本、技術、甚至政治的激烈爭論。

這場風暴的中心,是DeepSeek的母公司——High-Flyer。這家公司並非一夜之間崛起。早在2022年,High-Flyer位於中國南方的AI工程師團隊便驕傲地推出了一款新型AI超級計算機,並慷慨地將其免費提供給全國的研究人員使用。這台閃爍著冷光的灰色巨獸,由令人咋舌的10,000個Nvidia A100 GPU構成,這些GPU皆購自美國Nvidia公司,而這筆2021年的大規模採購,其時機之精妙,令人不得不細細思量。因為到2022年秋季,華盛頓已祭出禁令,禁止向中國出口A100晶片,意圖遏制中國的AI發展。自ChatGPT引爆全球AI熱潮以來,Nvidia晶片更是全球搶手貨,供不應求。

DeepSeek的低成本說法,立即引爆了各方質疑。Nvidia執行長黃仁勳甚至親赴白宮,與特朗普總統會面,而美國官員也正在調查DeepSeek是否通過第三方渠道繞過出口管制,獲得了先進的Nvidia晶片。OpenAI執行長Sam Altman公開表示對DeepSeek的成本說法深表懷疑,認為其能源效率估算“被嚴重誇大了”,並指出DeepSeek的模型水平是他們“很久以前就擁有的能力水平”。無人機製造商Anduril的創始人Palmer Luckey也在社交媒體上直言不諱地批評DeepSeek的低成本說法為“虛假”,並將矽谷的恐慌反應斥為“歇斯底里”。

研究公司SemiAnalysis則給出了更為保守的估計:DeepSeek在GPU上的投資已超過5億美元,總資本支出接近13億美元。這與DeepSeek宣稱的560萬美元形成巨大反差。High-Flyer方面則表示,建造早期超級電腦的成本就達到了10億元人民幣(約1.39億美元)。

然而,即使考慮到SemiAnalysis的估計,DeepSeek的成功仍然令人不安。其定價策略的極具競爭力,以及與領先競爭對手不相上下的模型性能,都讓美國同行不得不重新審視自身的競爭策略。DeepSeek的低成本背後,或許隱藏著高效的模型訓練方法,以及其母公司High-Flyer早期在超級計算機上的巨大投入所累積的經驗。

DeepSeek的崛起,並非完全依靠政府扶持。儘管DeepSeek創始人梁文峰近期得到中國政府的重視,包括與中國總理李強會晤,但DeepSeek的成功更多源於自下而上的創新,其技術實力更像是通過與頂尖大學(如清華大學)的合作,以及母公司High-Flyer提供的強大計算資源,逐步積累起來的。2022年3月,High-Flyer執行長黃盼盼介紹其10,000 GPU超級計算機時,曾豪言其運算能力在兩年內提升了100倍,並聲明將免費提供給大學和研究機構使用。

DeepSeek創始人梁文峰在接受採訪時,將High-Flyer購買大量Nvidia晶片的行為歸結於“好奇心”,以及對計算能力的無限渴望。這份“好奇心”以及High-Flyer早期看似不計成本的投入,或許才是DeepSeek今日成功的重要基石。

而DeepSeek的有限資源,也迫使他們在模型訓練方法上進行了更多創新。正如Qodo執行長Itamar Friedman所言,當你處於劣勢時,“你需要以不同的方式進行創新”。這或許也是DeepSeek能夠以低成本取得高回報的關鍵所在。

DeepSeek的成功故事,遠未結束。它不僅是一場技術的較量,更是一場關於成本、效率、創新,以及地緣政治的複雜博弈。 DeepSeek的崛起,為全球AI產業帶來新的變數,也為美國的科技霸權投下了一絲陰影。

謝謝大家收看六度探索!這是一個由科學家、經濟學家、媒體人、工程技術人員合作建立的新型媒體,網友與六度Ai參與、合作完成各種內容,這些內容不能作為任何決策或法律的意見。這是一個新型的試驗性媒體方式,我們希望得到大家的支持,修正錯誤。網友可以參與討論,也可以向萬能的六博士提出你能想出的任何問題,六度世界網址是6do.world!請介紹給你的親朋好友!