15.7 C
Berlin
星期六, 1 11 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《新世界》的最新扩展包中隐藏着一条告别信息,粉丝们开始了绝望的救援行动

亚马逊正在缩减自己的游戏业务,2021年推出的MMO游戏也是受害者之一——但玩家们还没有放弃。 亚马逊将裁减总计 14,000 个工作岗位,其中许多来自亚马逊游戏公司。目前尚不清楚这对《指环王》MMO 等正在进行的项目会产生何种影响。但《新世界:永恒》的命运似乎已注定。开发人员已经在游戏中道别,尽管粉丝们还不愿放弃。 《新世界》开发商在游戏中隐藏了告别信息 2025 年 10 月 13 日,《新世界》的最新也是最后的更新《夜港》已经发布。服务器将持续运行到 2026 年底,但除了季节性内容外,不会再有新内容了。 "亲爱的冒险者,我们的一切都是为了你。感谢你给我们带来这么多精彩的故事、胜利和欢笑。......祝你好运,晚安。"https://t.co/z46r6HlXba — Rachel Barnum (@OhThatRachel) 2025年10月28日 开发人员雷切尔·巴纳姆在 X 上分享了《新世界》游戏世界中的一个地点。在奈格港力量塔附近的小岛上,玩家可以找到开发团队的告别信。该留言总结了玩家与开发者们共同走过的旅程,最后写道:“亲爱的冒险者们,我们做这一切都是为了你们。感谢你们带来这么多精彩的故事、成就和欢笑。” 粉丝发起拯救请愿书 但社区并不想放弃《新世界》。一个 在线请愿书 在两天内就获得了超过 15,000 名玩家 的签名。发起请愿书的人希望: 如果得到足够的支持,我们可以向开发商表明他们的工作对《新世界》的粉丝和玩家有多么重要。如果您珍视这个游戏所提供的充满活力的社区、难忘的体验和持续的兴奋感,请签署这份请愿书,要求恢复《新世界:永恒》团队的工作,并继续更新新的 PvE...

不,《战地6:红色警戒》并不是有史以来最好的大逃杀游戏——但它绝对不值得在Steam上遭到如此严厉的批评。

《战地:红色警戒》已经发布,这款大逃杀游戏在Steam上遭到了大量负面评价。我已经玩了几轮,可以肯定地说:这些评价并不完全公平。 历史并不支持《战地》: Redsec:这个射击游戏系列曾两次尝试与《战区》和《逃离塔科夫》等游戏竞争。但《战地5》中的《火风暴》和《战地2042》中的《危险地带》都惨遭失败。现在,他们再次尝试进入大逃杀市场,但有一个很大的不同:从一开始,《战地: Redsec 从一开始就完全免费。那么,新的《战地》分支游戏是否有生存的机会呢?我们玩过这款游戏,认为:是的,但希望不会以《战地 6》为代价。 《战地》皮肤中的《战区》还是更多? 在 Redsec 的《大逃杀》中玩了几分钟后,就清楚地知道:它有一个明显的榜样,即《使命召唤》的《战区》。玩过《战区》的人也会很快熟悉 Redsec:乘坐直升机投送、寻找箱子里的武器和装备、任务、装备投送、炮击和装甲板。 总体的游戏循环和许多小机制都不是什么新鲜事。Redsec 并不想给这个类型带来革命性的变化,而是想提供一种带有《战地》特色的新选择。这些特色融入得相当不错:在每轮开始时,我们可以选择多人游戏中熟悉的 角色,每个角色都有特定的优势和装备: 突击兵 携带梯子,可用于迂回包抄固守阵地的敌人。他能够更快地补充装甲板,并更快地将阵亡的盟友带回重生塔。 先锋 携带工具,可以修理车辆和打开保险柜获取宝贵的战利品。他还配备了一台火箭发射器。 补给员 携带补给包,可以治疗盟友并为他们提供弹药。他的烟雾弹发射器还有助于掩护我们的撤退或进攻。 侦察兵可以使用无人机发现敌人,甚至进行轰炸。与多人游戏一样,当他瞄准敌人时,会自动标记敌人。 相对明确的角色分工有助于协调小队行动,加强合作。在进攻时,侦察兵可以提供掩护或通报敌人的位置,补给兵是唯一随时可以提供弹药和治疗的人,而工兵则是摧毁建筑物、保险柜和车辆的专家。 这让我们来到了第二个重要特点:车辆的作用更大。在《Redsec》中,我们不仅可以驾驶吉普车和四轮摩托车,还可以驾驶直升机和坦克。但首先,我们需要找到钥匙卡,才能从锁着的拖车里把坦克开出来。此外,这些车辆不像多人游戏中的车辆那样坚固:它们承受的打击较少,弹药也有限,只能在车辆站进行补充。 Redsec 表现如何? 我们已经进行了几轮大逃杀模式,可以自信地说:Steam 上那些差评对《战地:Redsec》并不公平。事实上,这是一款非常出色的全新类型游戏。巨大的地图提供了丰富的变化,从建筑密集的市中心到巨大的公司大楼、军事训练场、高尔夫球场、飞机坠毁现场等等: 每轮比赛都充满着大逃杀游戏特有的刺激感,每次死亡都至关重要,因为我们只有一次重来的机会。因此,作为小队,我们必须更紧密地合作,才能获得生存的机会。平静的时刻寥寥无几,我们大多是在一场场交火中奔忙,其间完成一些任务。《战地》的创新设计效果不错,尽管它并没有让《Redsec》成为一款全新的吃鸡游戏。但它为《战地》式的场景提供了空间,比如我们用坦克消灭整个小队,共同炸毁敌方车辆,或者用炮击摧毁我们头顶上的整栋建筑。 幸运的是,尽管还有些错误,但技术方面也没有太大问题。例如,我们可能会滑过地图下的地面,被保险柜门挤压在墙壁上,或者在回合结束后游戏崩溃。这些问题虽然令人恼火,但都可以修复。 如果你想在《战地6》中寻找更多刺激,有1到3个朋友一起玩,并且有足够的耐挫力,在死亡后能够直接开始下一轮游戏,那么就该试试Redsec的《大逃杀》模式。顺带一提,主菜单还提供机器人回合供你尝试。 挑战赛:Redsec在这里发挥创意 随着 Redsec 的推出,第二个主要模式 Gauntlet 也走入了人们的视野:在这个模式中,八支小队在不同的地图上相互对抗,必须通过完成任务获得尽可能多的积分才能获胜。每轮比赛结束后,最弱的小队都会被淘汰,地图也会缩小,直到最终只有两支小队争夺冠军。 Gauntlet 中的任务 与大逃杀模式不同,Battlefield 在 Gauntlet...

自 1998 年以来,我一直在玩多人射击游戏,但没有任何一款游戏能像《Arc Raiders》一样激发我如此强烈的探索欲望。

仅几轮游戏后,《Arc Raiders》就彻底颠覆了我们的射击游戏专家 Phil 的所有直觉。 近 30 年来,多人射击游戏一直是我的游戏首选。现在,有一款游戏在至少一个方面超越了我之前玩过的所有游戏:《Arc Raiders》让我突然变成了一个真正的探索者! 在《Arc Raiders》发售当天,我第一次玩这款游戏时就立刻意识到,这个世界不仅仅是一个与其他玩家交锋的多人游戏地图。 相反,我发现这是一个充满精心设计的细节、神秘事件和谜团的小型开放世界,以至于我暂时完全不想打斗了。 这完全不像我的作风,但我突然更想去探索这个世界了。 地球坠落之前 我的第一场比赛从一个古老的战场开始。我着迷地穿梭在烧焦的残骸之间,这些残骸像死去的巨型蜘蛛一样散落在地上。显然,这里曾发生过一场与阿克族之间的激烈战斗。 我从坑洞和残骸中收集了一些资源,思考着这里可能发生过的事情。在地球表面被机器人占领之前,这里是否曾发生过人类与机器之间的最后一场战斗? 我到处都能看到过去神秘的遗迹。不久后,我爬上了一辆巨大的阿克坦克的尸体,它发出奇怪的嗡嗡声。这辆巨兽还活着吗?我能启动它吗?如果可以,我应该启动它吗? 追寻过去的踪迹 我在屋顶上找到一个舱门,用撬棍撬开它,但这个钢铁怪兽却用突然燃起的火焰来回报我的闯入。 为什么?我不知道,但这很出人意料。而且不知为何,这非常迷人! 虽然说到底,弧形机器人只是人工智能对手,但它们的吸引力几乎像魔法一样。在轨道上发生了什么,这些致命的机器显然都是从那里来的?为什么我从教程开始就一直看到地平线上那些高大的弧形怪物,它们却不攻击我们?无论装备多么精良的突袭者,对它们来说都算不上真正的威胁。然而,它们却几乎和平地游荡着,而我们却与它们的小兄弟们进行了激烈的战斗。当我还在思考这些问题时,我偶然发现了一个废弃的营地。用波纹铁皮焊接的小屋、风力发电机,甚至还有一座小井,这些都证明了以前的人可能在这里生活过,直到方舟入侵的幸存者们最终被迫进入地下——从字面意义上来说。 我突然变得完全不同了 《Arc Raiders》非常擅长将地图打造得不仅仅是一个背景。这些地方似乎都有自己的历史和过去,并隐藏着古老的秘密。Embark 没有简单地提供一个让我寻找战利品并消灭其他玩家的竞技场,而是构建了一个有灵魂和个性化的世界。这个世界告诉我:这里还有更多东西。谁知道你会在下一个天花板后面发现什么呢? 突然之间,我几乎认不出自己的游戏风格了。我感觉自己像一个探索者,抛开了射击游戏的本能。我对当前流行的元装备不感兴趣。我积极避免冲突。我对自己的击杀/死亡比完全不感兴趣。相反,我一轮又一轮地投入《Arc Raiders》的游戏,试图解开这个末日田园诗般的谜团。做得真好,《Arc Raiders》。