嫦娥六号月背“挖宝”成功!首次采样起飞顺利进入环月轨道;富人患癌风险更高?基因研究揭示惊人真相;Mamba-2新架构出世,性能飙升8倍,统一SSM和Transformer:華爾街科技20240604

欢迎来到我们《华尔街科技》节目,我是你们的主持人:刘英子。今日的新闻概述如下:

首先,嫦娥六号成功完成了在月球背面的首次采样任务,并顺利进入了预定的环月轨道。这次任务不仅展示了中国航天的技术实力,还为月球研究带来了宝贵的样本和数据。嫦娥六号的快速智能采样技术和创新设计,克服了月球背面的通信和温差挑战,令人赞叹。

接下来,来自芬兰分子医学研究院的一项基因研究显示,富人患癌症的风险比穷人更高。这项研究分析了社会经济地位与疾病之间的关系,发现高收入群体在基因上更容易患前列腺癌和乳腺癌,而低收入群体则更容易患关节炎、糖尿病和抑郁症。这一发现可能会对未来的疾病筛查和预防策略产生重要影响。

最后,普林斯顿大学和卡内基梅隆大学的研究团队推出了全新的Mamba-2架构。这一新架构不仅在性能上飙升了8倍,还成功将状态空间模型(SSM)和Transformer统一起来。Mamba-2的出现,有望在人工智能和机器学习领域掀起新的浪潮,带来更多高效的解决方案。

请大家继续收看详细内容。

網易报道,6月4日7时38分,嫦娥六号上升器携带月球样品自月球背面起飞,成功进入预定环月轨道,完成了世界首次月球背面采样和起飞任务。嫦娥六号在月球背面南极-艾特肯盆地进行智能快速采样,成功将月球样品封装存放在上升器的贮存装置中。这次任务采用了快速智能采样技术,缩短了采样时间,并通过钻具钻取和机械臂表取两种方式采集样品。嫦娥六号着陆器配置了多种有效载荷,开展了月表形貌及矿物组分探测、月球浅层结构探测等任务。嫦娥六号着陆器还携带了欧空局月表负离子分析仪、法国月球氡气探测仪等国际载荷,进行了相应的科学探测任务。起飞后,嫦娥六号上升器经历了垂直上升、姿态调整和轨道射入三个阶段,顺利进入了预定环月轨道,并在月球背面成功展开了五星红旗。

封面新闻报道,嫦娥六号在月球背面南极-艾特肯盆地成功完成智能快速采样,并将样品封装存放在上升器的贮存装置中。6月4日7时38分,嫦娥六号上升器携带月球样品自月球背面起飞,成功进入预定环月轨道。嫦娥六号任务的核心环节是快速智能采样技术,通过钻具钻取和机械臂表取两种方式采集月球样品。嫦娥六号着陆器配置了降落相机、全景相机、月壤结构探测仪、月球矿物光谱分析仪等多种有效载荷,进行了月表形貌及矿物组分探测、月球浅层结构探测等任务。嫦娥六号着陆器还携带了欧空局月表负离子分析仪、法国月球氡气探测仪等国际载荷,进行了相应的科学探测任务。鹊桥二号中继星作为嫦娥六号的重要帮手,通过其强大的通信能力和科学载荷,为嫦娥六号提供了中继通信和科学探测支持。嫦娥六号起飞后,将与在环月轨道上等待的轨道器和返回器组合体进行月球轨道的交会对接,并将月球样品转移到返回器中,最终返回地球。这次任务不仅为人类探月留下了浓墨重彩的一笔,还首次在月球背面独立动态展示了五星红旗。

《自然》网站(www.nature.com)最近发表的研究表明,欧洲生物医学论文的撤稿率在过去20年内翻了四倍,从2000年的每10万篇论文约11篇撤稿增加到2020年的近45篇撤稿。撤稿的主要原因包括不当行为、诚实错误和未给出具体原因的不明原因。其中,不当行为占撤稿总数的67%,主要涉及伦理和法律问题、作者身份问题、图像和数据重复等。随着时间的推移,因“不可靠的数据”而撤回的论文比例显著增加,成为撤稿的重要原因之一。

《科学时报》网站(www.sciencetimes.com)报道,芬兰分子医学研究院的一项新研究发现,富人在基因上更容易患癌症。研究显示,社会经济地位较高的人患前列腺癌、乳腺癌等癌症的遗传风险较高,而较低收入群体则更容易患关节炎、糖尿病、酗酒、肺癌和抑郁症。研究人员提到,多基因风险评分可以根据遗传学来衡量疾病风险,未来可能会根据环境因素对筛查方案进行分层。例如,遗传风险较高的女性可能需要更频繁地进行乳腺癌筛查。这项研究基于对28万名35岁至80岁的芬兰人的健康数据、社会经济地位和基因组学数据的分析。

《每日科学》网站(www.sciencedaily.com)发表了一篇由88位科学家撰写的论文,呼吁紧急应对外来入侵物种的威胁。这篇论文指出,外来入侵物种的影响可能被低估了,预计未来这种威胁将继续上升。每年大约有200种新的外来物种被引入全球新的地区,这些物种会自然扩散并对新地区造成负面影响。此外,科学家们还发现了一种名为Parengyodontium的真菌能够分解海洋中的塑料聚乙烯颗粒,前提是这些塑料先暴露在阳光的紫外线辐射下。这一发现为解决海洋塑料污染问题提供了新的思路,研究人员预计在海洋深处还存在更多能够降解塑料的未知真菌。

北京商报讯(记者 刘洋 刘晓梦)——在今年一季度,由于电动车市场的传统淡季影响,全球牵引逆变器的装机量达到了522万套,环比减少了27%。其中,纯电车(BEV)的牵引逆变器装机量占比为48%,环比减少了5%;而油电混合动力车(HEV)及插电混合式电动车(PHEV)的牵引逆变器装机量则从47%升至52%。TrendForce集邦咨询方面预计,今年二季度牵引逆变器装机量将环比增长约10%至20%。

新智元报道——华南理工大学和香港大学的研究人员在ICML 2024上提出了一个名为FlashST的时空提示调整框架,旨在解决交通预测中时间和空间因素的分布偏移问题。通过轻量级的时空提示网络和分布映射机制,FlashST能够使预训练模型适应不同下游数据集的特定特征,从而显著提高模型在多种交通预测场景中的泛化能力。实验表明,FlashST在不同类型城市交通数据集中的有效性,能够捕捉时空不变知识并有效适应不同场景,解决了训练数据与测试数据之间分布不一致的问题。

新智元报道——在Computex主题演讲上,AMD推出了首批Zen 5处理器,包括台式机用的Ryzen 9000 CPU和笔记本电脑用的Ryzen AI 300“Strix Point”APU,同时宣布了芯片年更计划和第五代EPYC Turin处理器。AMD的最新MI325X加速器将于2024年第四季度上市,预计性能比英伟达H200快1.3倍。AMD还详细介绍了其未来两年开发人工智能芯片的计划,目标是挑战英伟达在人工智能半导体市场的领导地位。AMD首席执行官苏姿丰表示,人工智能是公司头等大事,未来每年都会有新的重大产品发布,以保持竞争力。

近日,斯坦福大学AI团队主导的Llama3-V开源模型被揭发抄袭中国清华大学与面壁智能共同开发的MiniCPM-Llama3-V 2.5,引发了广泛关注。斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上公开道歉,承认了学术不端行为,并表示将撤下Llama3-V模型。斯坦福人工智能实验室主任Christopher David Manning也谴责了这一行为,并对MiniCPM模型表示赞赏。事件起源于5月29日,当时斯坦福AI团队声称仅需500美元就能训练出一个超越GPT-4V的多模态大模型,但随后网友发现该模型的结构和代码与MiniCPM-Llama3-V 2.5极为相似,甚至连错误都一模一样。面壁智能团队证实了这一抄袭行为,指出Llama3-V可以识别出“清华简”战国古文字,这些数据是团队花费数月时间逐字扫描并人工标注的,未对外公开。面壁智能CEO李大海对此表示遗憾,同时呼吁建立开放、合作和信任的社区环境。面壁智能首席科学家刘知远强调,人工智能的发展离不开全球算法、数据与模型的开源共享,但这种共享必须建立在对开源协议的遵守和对前人成果的尊重基础上。面壁智能在今年2月发布了MiniCPM开源模型,并在4月完成了新一轮数亿元融资,未来将继续推动大模型在端侧的应用。

網易

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI

Transformer的挑战者、新架构Mamba,刚刚推出了第二代:Mamba-2。这个新版本不仅将状态空间扩大了8倍,还将训练速度提高了50%!更令人惊讶的是,研究团队发现Transformer和状态空间模型(SSM)之间竟然存在紧密的数学联系,两者可以通过一个叫结构化状态空间二元性(SSD)的理论框架统一起来。这一发现颠覆了人们对这两大主流序列建模架构的认知。Mamba一代论文曾在年初被ICLR拒稿,引起了学术界的热议,但这次的二代论文在理论和实验上都更为丰富,成功入选了ICML 2024。论文的核心发现是Transformer中的注意力机制与SSM可以表示为可半分离矩阵的变换,从而揭示了它们之间的紧密联系。Mamba-2在架构设计上做了多项改进,包括支持更大的状态维度、简化块设计以及引入多输入SSM,这些改进使得模型在训练速度和推理性能上都有显著提升。实验结果表明,Mamba-2在300B tokens训练中,超越了相同规模的Mamba-1和Transformer,特别是在需要更大状态容量的任务上表现优异。团队还实验了Mamba-2和注意力层的混合架构,发现这种混合模型的性能甚至优于现有的最佳实践。作者们还撰写了四篇易读的博客文章,建议读者先看博客再看论文,对Mamba-2模型或者状态空间二元性理论感兴趣的读者可以深入了解。

網易报道,微软最近发布了一个名为Aurora的大规模大气基础模型,宣称其计算速度比当前最先进的数值预报系统快了约5000倍。这一突破性进展让人类在预测和减轻极端天气影响方面迈出了重要一步。Aurora不仅能从大量大气数据中学习并做出高效预测,还展示了惊人的准确率。微软研究团队通过在欧洲中期天气预报中心维护的丰富数据集上进行预训练,使Aurora能够在各种天气条件下表现出色。Aurora的多功能性和灵活性使其能够预测从温度、风速到空气污染水平和温室气体浓度的广泛大气变量。其高空间分辨率下的运行能力使其能够捕捉大气过程的复杂细节,提供比以往任何时候都更准确的业务预报。Aurora在处理异构数据和生成不同分辨率预测方面表现出色,进一步证明了其在大气预报中的卓越适应性和潜力。研究还显示,通过在多个数据集上预训练,Aurora的性能显著提高,能够在数据稀缺地区也提供准确的天气和气候信息。这一进展不仅对天气预报有深远影响,还为开发涵盖整个地球系统的综合模型铺平了道路,使社区能够更好地适应气候变化带来的挑战。

台积电近年来在全球半导体行业中占据了重要地位,其用电量和经济贡献度也在逐年增加。台积电董事长刘德音在股东大会上透露,预计今年台积电的用电量将占全台湾的8%,并在2030年达到11-12%。尽管面临缺水缺电的挑战,台积电与相关部门保持紧密联系,力求通过扩充电力供应和有效管理水资源来应对这些问题。刘德音表示,虽然晶圆厂在生产过程中需要大量超纯水,但相较于电力需求,水资源的紧张程度相对较小。标普全球评级公司也曾指出,台积电在发展过程中面临的缺水风险,尤其是在半导体工艺日益复杂的情况下,用水量将会进一步增加。

微软Azure云部门近期进行了大规模裁员,至少有1500名员工受到影响,主要集中在Azure运营商业务团队和任务工程团队。据Business Insider报道,这次裁员的目的是为了将资源集中到微软的AI业务上。Azure运营商业务团队和任务工程团队成立于2021年,负责包括量子计算和太空技术在内的前沿项目。随着微软和OpenAI的合作逐渐见效,微软在AI领域的投入不断增加。微软全球副总裁施洋领导的团队重组也反映了公司对AI的重视。Jason Zander在内部邮件中表示,公司将停止一些预览服务,并将相关团队转移到微软云+AI组织内部,以更好地推动AI业务的发展。

iPhone 15系列在中国市场的价格大幅跳水,尤其是在京东平台上,iPhone 15 Pro的价格首次跌破6000元。苹果在5·20大促期间,天猫旗舰店的优惠力度高达2300元,吸引了大量用户抢购。尽管第一轮降价后,许多用户选择观望,但在京东6·18大促中,iPhone 15系列再度降价,促使更多用户购买。iPhone 15系列的频繁降价也反映了苹果在面对国产手机品牌竞争时的压力。尽管苹果在高端市场仍具备强大产品力,但在华为等国产品牌崛起的背景下,苹果通过降价来提升市场热度。然而,长期依赖降价并非长久之计,苹果未来还需在AI等新技术领域加大投入,以保持其市场竞争力。

謝謝大家收看以上節目。這是我們的編輯團隊為大家搜集、整理的,認為有價值的信息、觀點,但是並不一定代表我們立場,不作為任何行為的建議。歡迎大家為我們的節目點赞,訂閱我們的頻道。謝謝!