超ChatGPT登顶美榜第一!爆火的DeepSeek,可能引发美国芯片调查
来源 | 综合自财联社、钛媒体AGI、九派新闻、DeepTech深科技等
这个周末,来自东方的神秘力量,彻底引爆了全球科技圈!
最近,中国 AI 大模型创业公司DeepSeek(深度求索)正式发布 DeepSeek-R1大模型,称在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。但其API调用成本却低了90%-95%。
按一位Meta员工的话,他们每个‘领导’的薪资都比训练整个 DeepSeek-V3 的成本还要高。而我们有好几十个这样的“领导”。
这一消息震动了全球 AI 圈,也让美国 AI 公司研究人员感到吃惊于中国赶超了美国大模型技术。
新模型发布后的访问量激增,一度让DeepSeek闪崩,但问题在数分钟内得到解决。AI界上一次出现宕机情况,还是月之暗面的Kimi出圈爆火之时。
1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
上一次在欧美引起如此追捧的还是《黑神话:悟空》。无独有偶,1月26日晚11点32分,黑神话的创始人冯骥在微博发文力推DeepSeek,表示:DeepSeek,可能是国运级别的科技成果。
冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
值得注意的是,爆火的DeepSeek有可能引发美国的芯片调查。
达沃斯世界经济论坛期间,Scale AI创始人亚历山大·王(Alexandr Wang)直言,DeepSeekAI大模型性能大致与美国最好的模型相当。他认为,过去十年来,美国可能一直在 AI 竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。
但同时,Alexandr Wang还提到:“DeepSeek大约有5万张H100计算卡,他们显然不能谈论这件事,因为这违反了美国实施的出口管制。我认为这是真的,我认为他们的筹码比其他人预期的要多,但也会继续前进。他们将受到芯片控制和出口管制的限制。”
DeepSeek创始人、头部量化私募幻方量化创始人梁文锋曾表示,DeepSeek面临的主要制约因素不是资金,而是高端算力的使用权,这些芯片对于训练先进AI模型至关重要。
随着AMD证实DeepSeek正在使用最强 AI 芯片之一的MI300X进行大模型推理,所以,对于中国 AI 如何突破围栏实施大模型训练,将成为关键话题。
公开资料显示,Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。
Mon, 27 Jan 2025 03:21:35 GMT 原文链接🔗: