14.1 C
Berlin
星期二, 26 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

全新詹姆斯·邦德电子游戏:《007 First Light》剧情扣人心弦,游戏玩法细节曝光

IO Interactive宣布推出一款名为《007 First Light》的全新詹姆斯·邦德电子游戏。该作计划于2026年5月27日发售。该游戏将登陆多个平台,包括PlayStation 5、Xbox Series X、Xbox Series S、Nintendo Switch 2和PC。作为一款融合潜行元素的动作冒险游戏,它被ESRB评为“青少年级”,这意味着其中包含血腥、冒犯性主题和暴力内容。剧情与游戏机制在《007 First Light》中,玩家将扮演一位正在参加军情六处培训计划的年轻詹姆斯·邦德。故事始于邦德因一次英勇之举而脱颖而出,从而加入00计划。游戏的核心任务之一是阻止一名叛变的特工,这使得邦德和他不情愿的导师格林威卷入了一场深谋远虑的阴谋之中。游戏玩法详情在《007 First Light》中,玩家可以选择不同的战术:悄无声息地潜入,或是大张旗鼓地动用火力。使用小道具和虚张声势来躲过守卫也是游戏玩法的一部分。带有额外变量的可重复任务将确保游戏乐趣持久不衰。开发商与平台IO Interactive 负责《007 First Light》的开发与发行。该游戏专为最新一代主机开发,包括...

《深红沙漠》更新风暴:核心改进与重大更新——专为犹豫不决的玩家准备的全面指南

Pearl Abyss开发的这款开放世界冒险游戏更新速度之快,让人难以跟上。我们为您总结了可能影响购买决策的关键更新内容。像《Crimson Desert》这样的蜕变,我确实很少见到!虽然在发售时,《Crimson Desert》已经是一款非常出色的游戏。但当时也存在一大堆问题,特别是在游戏引导和便捷功能方面。但自游戏发布以来,Pearl Abyss 便接连不断地推出补丁!而且速度快得令人目眩!快到我在写完这篇文章后,为了保险起见,还特意重新查看了一遍,以确认在这短暂的时间里是否又出现了更多更新内容。而且我们谈论的绝非小事,有时甚至一夜之间就会出现全新的游戏内容!其中一些改动,早在试玩预览版时——也就是正式发布前很久——我就曾期待过。当时我们当然也向开发者提过这些建议,但在游戏发布前却鲜有进展。但当首批玩家的反馈传来后,事情突然就进展得非常快。速度之快,甚至让人觉得其中一些调整在游戏发布前就已列入了团队的待办事项清单。但这绝不减损团队在此展现出的投入与热情。在短短两个月内,Peal Abyss 发布了八次重大更新,此外还有更多的小型补丁和热修复。即便你热衷于研究补丁说明,也很难掌握全部更新内容。不过,有我们在就没问题了。如果你一直在观望是否购买《Crimson Desert》,那么这篇文章将为你提供一份清晰的总结,列出我认为自游戏发布以来最重要的改进内容。背包 难度等级BOSS战与障碍坐骑与宠物开放世界制作系统后续展望背包系统:体验更舒适,烦恼更少我最希望在游戏发布时就有的改进,就是背包系统。一想到以前在有限的背包空间里手忙脚乱地整理物品……但这一切都已成为过去!首先,《绯红荒野》现在直接提供了更多的背包空间,而且许多商人出售价格实惠的背包扩展道具。其次,设有不同的标签页用于……武器与护甲 食物与消耗品 配方与制作材料 文书与书籍 特殊物品与任务物品。 此外,同类物品现在会自动分类。也就是说,所有头盔放在一起,所有剑放在一起,以此类推。克利夫的家现在增加了四个特殊的储物箱。这些在游戏发布时还缺失,我一直不太理解为什么。毕竟,玩家需要随身携带大量的制作材料和装备,背包很快就会被塞得满满当当。现在,你们将获得一个用于存放食物的“冰箱”、一个用于存放矿石和皮毛等制作材料的储物箱、一个用于存放配方书等收藏品的箱子,以及一个用于存放服装的衣柜。尽管有了这些改进,但我觉得背包系统仍然不够完美。例如,如果能在开箱前预览宝箱或被击败敌人的口袋里有什么,那就太好了。而且,如果钱不再总是散落在小钱袋里就更好了。我必须费劲地在背包里再次打开它们,才能真正将金币存入账户。是的,我知道这些钱袋是用来作为礼物来讨好NPC的。不过,直接赠送一定金额的金币不也行吗?但与游戏发布时的背包系统相比,这些确实只是小问题。难度等级:适合每个人的挑战这大概是第二重要的改进,面向所有在《Crimson Desert》的BOSS战中感到绝望或厌倦的玩家。现在有三个难度等级可供选择:简单、中等和困难。其中中等难度与游戏发布时唯一可选的难度一样具有挑战性。在“简单”难度下,敌人的伤害较低,生命值较少,攻击频率降低,整体行动也更慢。闪避和反击的时机窗口变大,BOSS 闪避和反击的频率也降低。而在“困难”难度下,情况则完全相反。此外,食物恢复生命值的速度会变慢。有些 BOSS 甚至会使用新的攻击方式。我最喜欢新难度模式的一点在于,它们不仅调整了伤害数值,还引入了新的攻击方式,整体的时机把握也变得更加棘手。毕竟,单纯的“子弹海绵”策略谁都会。未来,Pearl...

PS5的颠覆性尝试:Digital Foundry 展示了 Steam 游戏在索尼主机上的运行表现

索尼的 PlayStation 5 究竟能与当今的 PC 抗衡到什么程度?Digital Foundry 进行了相关测试,并得出了明确的结论。索尼的PlayStation 5实际上是一个封闭性极强的系统——但如果强行让这台主机充当一台名副其实的PC,会发生什么?Digital Foundry的技术专家们正是针对这个引人入胜的问题在 YouTube 栏目《DF Direct Weekly》的最新一期中进行了探讨。他们利用一个技巧,在原本受保护的游戏主机上运行了Linux系统,通过Proton兼容层测试了完整的Steam游戏。这正是Valve的Steam Machine将采用的技术,用于在Linux环境下运行PC游戏。部分游戏性能可媲美PS5版本实验结果令人惊叹:在《Black Myth: Wukong》等游戏中,性能表现竟与原生PS5版本极为接近。尽管这款PC游戏在Linux系统下必须通过Proton(将DirectX转换为Vulkan)的转换软件运行,但据Digital Foundry的Richard Leadbetter称,其性能和视觉质量几乎与原生PS5性能模式完全一致。对于DF专家Alex...