新基准ZeroBench震撼来袭!多模态模型全军覆没;高通骁龙6Gen 4发布!千元机市场的新标杆;马斯克发布Grok 3!号称地球上最聪明的AI:華爾街科技20250218

歡迎來到我們的《華爾街科技》節目,我是你們的主持人:劉英子。今天我們將帶您了解幾個激動人心的科技新聞。首先,ZeroBench這個新基準的出現讓多模態模型們面臨了前所未有的挑戰,20多個知名模型在這項測試中全數得零分,這究竟是為何?接著,高通最新發布的骁龙6Gen 4芯片,將千元機市場推向了一個新的高度,這款芯片的性能提升和AI支持功能讓人期待。最後,馬斯克又出手了,他的Grok 3被稱為地球上最聰明的AI,這場AI的競爭又將如何發展呢?請大家繼續收看詳細內容。

网易报道,当前多模态模型面临着一个名为“ZeroBench”的全新视觉基准测试,结果显示包括GPT-4o和Gemini 2 Flash在内的20多个知名模型均以零分告终。ZeroBench包含100个极具挑战性的问题,旨在测试模型的视觉理解和推理能力。问题的复杂性和多步骤性让这些模型显得力不从心,例如计算菜单中每款菜品的总价、推理保险箱密码等,甚至连简单的图像分析都难以应对。这个基准的设定不仅让人惊叹于其难度,也让人思考现有模型在视觉理解方面的局限性。

腾讯报道,高通在2月12日发布了全新的骁龙6Gen 4移动平台,旨在重新定义千元级市场的处理器标准。该芯片采用台积电4nm工艺,CPU和GPU性能分别提升11%和29%,功耗降低12%。骁龙6Gen 4不仅支持1080p+分辨率和144Hz刷新率,还首次引入AI支持,能够为千元机用户提供更丰富的功能体验。该芯片的发布被视为高通在低端市场的一次重要布局,预计将推动千元机市场的技术创新与竞争,提升消费者的使用体验。

钛媒体AGI报道,随着开源AI模型的热潮不断升温,2月18日一天内就有五个新模型宣布开源,其中包括阶跃星辰与吉利汽车合作的Step系列多模态大模型。该系列包含全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互大模型Step-Audio,标志着中国在AI领域的快速发展。根据IDC和浪潮信息的报告,预计到2025年,中国智能算力市场将增长43%。这一系列的开源举措不仅推动了AI技术的普及,也为相关产业的发展注入了新的动力,显示出中国在全球AI竞争中的潜力与活力。

36氪报道,北京中科慧灵机器人技术有限公司(灵宝CASBOT)最近完成了超亿元的天使轮融资,投资方包括联想创投和国投创合等。灵宝CASBOT成立于2023年,专注于研发人形机器人和具身智能产品,其核心团队由国内外顶尖高校和科技企业的专家组成,拥有丰富的研发经验。该公司在2024年发布了其首款双足人形机器人CASBOT 01,具备52个自由度和550T的算力,并计划在2025年进行量产。灵宝CASBOT还在多个领域积累了合作伙伴,并在中关村仿生机器人大赛中获得多个奖项,展现出强大的技术实力和市场潜力。

腾讯报道,韦尔股份创始人虞仁荣因其在芯片行业的成就而备受关注,尤其是其公司在高端CIS领域实现国产替代,成为全球前十大芯片设计公司之一。韦尔股份的业绩显著增长,预计2024年营收将达到254-258亿元,净利润将大幅提升。豪威科技是韦尔股份的重要子公司,其推出的OV50H传感器已被多款国产旗舰手机采用,标志着其逐步摆脱对海外高端CIS的依赖。虞仁荣的成功不仅是个人的胜利,也是中国芯片行业崛起的缩影,显示出国产技术在全球市场中的竞争力。

腾讯报道,马斯克在其“政府效率部”的调查中揭示了美国社保系统的混乱,称其存在“史上最大欺诈”。他公布的数据表明,美国社保数据库中存活人数超出美国总人口近6000万,其中150岁以上的老人超过140万,甚至有360岁以上的“老人”。马斯克对此表示愤怒,认为这显示了政府数据管理的严重问题。他的改革措施包括裁撤多家政府机构和优化劳动力,旨在减少联邦赤字并提高政府效率。然而,这些措施也引发了广泛的争议,许多人质疑其合法性和可行性,认为仅靠“小手术”难以解决美国政府长期存在的结构性问题。

搜狐近日发布了2024年第四季度及全年财务报告,显示总收入为5.98亿美元,其中第四季度收入为1.35亿美元,品牌广告收入达1900万美元,在线游戏收入为1.10亿美元。搜狐创始人张朝阳表示,品牌广告收入超出预期,在线游戏业务表现稳健,得益于高质量新游戏的推出和经典老游戏的精细化运营。为了提升用户体验,搜狐媒体平台持续优化产品和算法,结合独特的IP资源,吸引了更多用户关注,激发了商业化潜力。

在人工智能领域,马斯克于2月18日发布了最新的聊天机器人Grok 3,称其为“地球上最聪明的人工智能”。他表示,Grok 3的性能比前一代产品Grok 2强大了一个数量级,得益于团队的努力和对训练流程的改进。此次发布会吸引了广泛关注,Grok 3将于美国当地时间周一面向X平台的付费用户开放,标志着马斯克在AI领域的又一重大进展。

马斯克的xAI公司致力于推动人工智能技术的前沿,Grok 3的发布不仅展示了其技术实力,也引发了外界对未来AI发展的期待。马斯克强调,Grok 3的自我纠正和强化学习能力使其在众多竞争对手中脱颖而出,未来可能会在多个领域产生深远影响。

網易:2025年,中国汽车市场将在温和增长的背景下,经历一场深刻的“智”变。瑞银预测,全年批发量将达到2832.4万辆,同比增长3%,而新能源车(NEV)的渗透率将从2024年的45%跃升至55%。传统燃油车销量将下滑15%,市场份额跌破45%。政策刺激、成本优势以及消费者预期的转变是推动这一变化的主要因素。此外,随着技术的迭代,BEV(纯电动车)预计将在2025年迎来反攻,市场份额将回升至60%以上。充电设施的完善和电池成本的降低,为BEV的普及提供了有力支持。

網易:在出口方面,中国汽车面临欧美市场的关税壁垒,预计2025年出口增速将放缓至10%。然而,南半球市场成为新的增长极,尤其是在拉美和中东地区,中国品牌通过本地化组装和性价比优势逐渐占领市场。数据显示,2025年中国汽车出口总量将达到517.2万辆,其中新能源车占比显著提升至35%。与此同时,AI技术的快速发展为汽车行业带来了新的竞争格局,智能驾驶和制造效率将成为车企的核心竞争力,特斯拉在中国市场的困境也为本土企业提供了发展机会。

網易:在技术创新方面,逐际动力推出了基于视频生成大模型的具身操作算法LimX VGM,实现了将人类操作数据直接应用于机器人操作的突破。该算法通过后训练现有视频生成大模型,仅需少量人类操作视频数据,即可生成符合机器人操作逻辑的行为轨迹。引入深度信息和空间智能模块,使得生成的操作视频包含三维空间数据,提升了机器人的操作能力。此外,该算法与机器人本体解耦,可实现跨平台部署,展现出强大的适应性和效率。逐际动力计划进一步优化算法性能,以提升操作执行的精准性和实时性。

腾讯报道,马斯克最近发布了Grok 3大模型,声称其为“地球上最聪明的人工智能”,并与OpenAI及DeepSeek等模型展开竞争。Grok 3的训练计算能力比前一代提升了10倍,使用了20万张GPU卡进行训练,获得了多个测试中的优异成绩,如数学能力测试中得分52,超越DeepSeek-V3的39分。马斯克表示,Grok 3的推理能力强大,甚至在演示中解决了物理题并创作了游戏。尽管如此,分析人士指出Grok 3在某些性能测试中并未显著优于其他模型,同时马斯克也承认其语音模式还有待完善。

网易报道,Grok 3的发布不仅是技术上的突破,也引发了马斯克与OpenAI之间的竞争加剧。就在Grok 3发布的同时,OpenAI正在考虑为其董事会赋予特殊投票权,以抵御马斯克的收购要约。马斯克曾提出以974亿美元收购OpenAI,但遭到董事会的拒绝,OpenAI表示将继续其非营利使命。马斯克与OpenAI的分歧源于他对公司的控制权和盈利模式的担忧,而OpenAI则在寻求更多资金以支持其发展。尽管马斯克的收购计划未能实现,但他仍在积极推动xAI的发展。

在竞争日益激烈的人工智能领域,开源成为了未来发展的关键。OpenAI正在考虑推出开源项目,以应对DeepSeek等新兴模型的挑战。随着AI技术的快速发展,国内外企业面临着新的机遇与挑战。专家指出,AI的成功不仅依赖于硬件资源的堆积,更需要高效的算力调度和模型优化能力。随着特斯拉Model Q的推出,马斯克希望通过价格亲民的产品重振特斯拉在市场上的地位,但面对国内竞争对手的压力,Model Q能否成功仍需观察。

謝謝大家收看以上節目。這是我們的編輯團隊為大家搜集、整理的,認為有價值的信息、觀點,但是並不一定代表我們立場,不作為任何行為的建議。歡迎大家為我們的節目點赞,訂閱我們的頻道。謝謝!