19.4 C
Berlin
星期日, 14 9 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《足球经理26》展示了足球经理真正重视的东西:积分榜而不是图形

《足球经理26》由于转换到 Unity 引擎,获得了重大的图形更新。但对于真正的粉丝来说,这只是个小细节。现在,开发商 Sports Interactive 展示了真正重要的东西: 用户界面。 在足球经理系列的新版本中,该界面不仅进行了外观上的改造。新的“磁贴和卡片”系统让您一目了然地看到最重要的信息,同时只需点击一下,您就可以深入了解更详细的信息。旧版启动屏幕已被门户网站取代,该门户网站汇集了所有新闻、任务和日历数据。 导航将更加精简,搜索功能将更加智能。对于新手来说,名为 FMPedia 的新游戏内词典非常有用,它可以解释复杂模拟游戏的所有细节。此外,您还可以使用书签自定义界面,以便随时直接访问最重要的游戏区域。 《足球经理 26》将于 2025 年 11 月 4 日发售。

“一小步后退”——《黑色行动7》改变了移动方式

降低速度,提高控制力——全新的游戏体验 当《使命召唤:黑色行动 7》于 11 月发售时,不仅故事线将成为焦点,许多粉丝也会立即注意到一个变化:移动方式。近年来,冲刺、滑行和攀爬的速度越来越快,而 Treyarch现在却有意放慢了脚步。D所谓的“战术冲刺”,此前为玩家提供了极端的加速升级,但在标准版本中已完全取消。 但这并不意味着社区必须放弃加速。设计总监马特·斯克朗斯在官方视频中解释道:  “《黑色行动 7》中核心动作的基本设计理念是退后一步。” 同时,他还透露,为此略微提高了基本速度。如果玩家仍然想使用战术冲刺,可以通过特权系统激活它。这是一个聪明的技巧,可以区分战术行动和激进推进。 Treyarch 由此回应了粉丝群体中经常出现的激烈争论:Call of Duty 应该继续作为策略射击游戏,还是成为追求刺激的玩家们的高速旋转木马?通过这种做法,该工作室希望满足双方的需求。 不像乒乓球——可以跳墙,但不能使用喷气背包 另一个事先引起轰动的是预告片中那些壮观的跳跃动作。许多玩家担心喷气背包和夸张的动作会卷土重来。但斯克朗斯明确表示:“你们看到的是我们的动能跳跃——它只出现在合作战役中。” 而在多人游戏中,Treyarch 则侧重于改进的“全向移动”和墙跳功能。最多可连续跳跃三次,但每次跳跃的冲力都会逐渐减弱。Scronce 表示:“我们希望避免玩家像乒乓球一样在地图上飞来飞去。” 不会出现墙跑或双跳,未来派的喷气背包也不会出现。 在合作模式中引起轰动的钩爪可能会被整合到 20v20 战斗中——目前工作室仍在测试它是否符合平衡性要求。此外,粉丝们还可以期待经典的《黑色行动》地图的全新版本,据说这些版本将“前所未有”。 通过这些调整,Treyarch 试图在现代创新与怀旧的游戏体验之间取得平衡——这种平衡对于《黑色行动 7》的成功至关重要。

复古未来主义RPG《以太与钢铁》公布新实机演示

GlobalESportNews独家披露《以太与钢铁》最新预告片,展示这款即将面世的RPG游戏的多元特色。由Seismic Squirrel工作室开发的本作目前计划于2026年发售,但具体上市日期尚未公布。《以太与钢铁》于2025年3月首度亮相,是一款以1930年代纽约为背景的复古未来主义叙事型战术RPG。在该作的架空历史设定中,反重力技术彻底重塑了人类生活的方方面面,而驱动这项技术的正是名为“以太”的神秘物质。这款桌面角色扮演游戏让玩家扮演吉娅·兰达佐——一位在纽约大苹果城寻求人生转机的疲惫走私者。 《以太与钢铁》展示载具改装、战术战斗等特色 华盛顿州伊萨夸市开发商Seismic Squirrel在公布蒸汽朋克RPG半年后,再度释出《以太与钢铁》预告片,GlobalESportNews获得独家披露权。这段75秒的视频确立了游戏的核心设定:玩家将扮演走私者,在执行各类任务时需兼用说服、欺骗与暴力手段。视频同时展示了《以太与钢铁》的多项玩法特色,包括战术战斗与载具改装系统。 约20秒处可见蒸汽朋克风格的车库场景,主角在此调试座驾。预告片展示了六个组件槽位,分别用于选择引擎、推进装置(称为反重力推进器)及最多四种武器。所选部件将决定车辆的重量、行动点数、储物容量以及“热度”——该数值似乎衡量着载具的显眼程度。《以太与钢铁》还将允许玩家招募并升级盟友,调整装备配置,决定走私人员员及携带装备类型。所有决策都将在回合制载具战斗中体现,该战斗系统融入了环境威胁等TRPG经典元素。 《以太与钢铁》剧情由《质量效应》《孤岛惊魂》编剧执笔 预告片还展示了若干任务场景,其目标设定远不止于消灭所有敌人。部分任务设有回合限制,另一些则要求玩家在敌军持续波次进攻中完成目标。这款基于Unity引擎的作品承诺由曾参与《质量效应》《孤岛惊魂》及2024年维多利亚蒸汽朋克RPG《主权联盟》的编剧团队执笔。根据项目官方简介,玩家将在虚构的1930年代纽约城阴暗街头展开探索,通过关键抉择影响城市命运。此设计暗示《以太与钢铁》将具备可重复游玩的价值。 叙事深度、政治主题、对话驱动的游戏环节以及科幻设定等元素,均表明《以太与钢铁》或将吸引《迪斯科伊甸园》的粉丝群体——尽管它并未像ZA/UM工作室2019年爆款游戏那样完全摒弃传统战斗系统。随着2026年发售日临近,这款复古未来主义作品的更多细节预计将在未来数月陆续揭晓。