超ChatGPT登顶美榜第一！爆火的DeepSeek，可能引发美国芯片调查

6doer · January 27, 2025, 3:30am

来源 | 综合自财联社、钛媒体AGI、九派新闻、DeepTech深科技等

这个周末，来自东方的神秘力量，彻底引爆了全球科技圈！

最近，中国 AI 大模型创业公司DeepSeek（深度求索）正式发布 DeepSeek-R1大模型，称在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。但其API调用成本却低了90%-95%。

按一位Meta员工的话，他们每个‘领导’的薪资都比训练整个 DeepSeek-V3 的成本还要高。而我们有好几十个这样的“领导”。

这一消息震动了全球 AI 圈，也让美国 AI 公司研究人员感到吃惊于中国赶超了美国大模型技术。

新模型发布后的访问量激增，一度让DeepSeek闪崩，但问题在数分钟内得到解决。AI界上一次出现宕机情况，还是月之暗面的Kimi出圈爆火之时。

1月27日，Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT。

上一次在欧美引起如此追捧的还是《黑神话：悟空》。无独有偶，1月26日晚11点32分，黑神话的创始人冯骥在微博发文力推DeepSeek，表示：DeepSeek，可能是国运级别的科技成果。

冯骥表示：“希望DeepSeek R1会让你对当前最先进的AI祛魅，让AI逐渐变成你生活中的水和电。太幸运了！太开心了！这样震撼的突破，来自一个纯粹的中国公司。知识与信息平权，至此又往前迈出了坚实的一步。”

值得注意的是，爆火的DeepSeek有可能引发美国的芯片调查。

达沃斯世界经济论坛期间，Scale AI创始人亚历山大·王（Alexandr Wang）直言，DeepSeekAI大模型性能大致与美国最好的模型相当。他认为，过去十年来，美国可能一直在 AI 竞赛中领先于中国，但DeepSeek的AI大模型发布可能会“改变一切”。

但同时，Alexandr Wang还提到：“DeepSeek大约有5万张H100计算卡，他们显然不能谈论这件事，因为这违反了美国实施的出口管制。我认为这是真的，我认为他们的筹码比其他人预期的要多，但也会继续前进。他们将受到芯片控制和出口管制的限制。”

DeepSeek创始人、头部量化私募幻方量化创始人梁文锋曾表示，DeepSeek面临的主要制约因素不是资金，而是高端算力的使用权，这些芯片对于训练先进AI模型至关重要。

随着AMD证实DeepSeek正在使用最强 AI 芯片之一的MI300X进行大模型推理，所以，对于中国 AI 如何突破围栏实施大模型训练，将成为关键话题。

公开资料显示，Deepseek来自国产大模型公司深度求索，系量化巨头幻方量化旗下大模型公司。

去年12月DeepSeek-V3发布后，AI数据服务公司Scale AI创始人Alexander Wang就发帖称，DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时，中国（科技界）在工作，以更低的成本、更快的速度和更强的实力赶上。”

不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。

Mon, 27 Jan 2025 03:21:35 GMT 原文链接🔗：