17.7 C
Berlin
星期四, 16 4 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《地铁4》现已正式公布,游戏名为《地铁2039》,即将揭晓

《地铁》系列的第四部作品终于正式公布,预计很快就会正式亮相。4A Games 和 Deep Silver 已在 YouTube上发布了一段简短的预告片,正式宣布了《地铁:2039》——这款后末日射击游戏系列的第四部作品。但这还不是全部,他们还透露了何时会有更多消息——而且就在很快之后。本周即将开启2026年4月16日德国时间19:00,4A Games与Deep Silver将携手微软举办一场名为Xbox First Look的特别活动。届时将正式揭晓这款游戏。会有什么看点?目前尚无确切信息,但至少可以期待看到游戏实机演示和剧情初探。此外,公布具体发售日期或至少发售时间段的可能性也很高。目前我们对这款游戏一无所知,所以无论如何都会非常有趣。什么是《地铁》?《地铁》改编自俄罗斯作家兼记者德米特里·阿列克谢耶维奇·格卢霍夫斯基的同名小说系列。该系列讲述了一群幸存者在核末日后躲藏在莫斯科地铁中,从此为每一天的生存而奋斗的故事。该系列游戏将阴郁的氛围与严肃的剧情,与刺激的射击和生存元素完美融合。首部作品《地铁:2033》于2010年问世,紧随其后的《地铁:最后的曙光》则于2013年发布。迄今为止的最新作《地铁:出埃及记》于2019年问世,距今已有七年之久。这三款游戏均获得了我们至少85分的评分,因此对《地铁:2039》的期待自然很高。就在《地铁:2039》公布仅一天后,科幻射击游戏《Pragmata》即将面世。虽然它比《地铁》系列明显不那么阴暗,但激烈的战斗场面依然毫不吝啬。

《战地6》:新闻、预告片及全面攻略一览

2025年10月10日,《战地6》正式登陆PlayStation 5、Xbox Series X|S及PC平台。由《战地》工作室开发、艺电(Electronic Arts)发行的本作作为该系列的最新力作,承诺将带来一场扣人心弦的战争体验,重点聚焦于多人游戏元素和横跨全球的战役。游戏采用寒霜引擎(Frostbite)并支持跨平台游玩,但无法在 Steam Deck 上运行。多人游戏与新模式《战地6》拥有丰富多样的多人游戏模式,包括“占领”、“突击”和“冲锋”等经典的大规模战斗。此外还新增了节奏更快的游戏模式,如“占领高地”、“统治”和“运送”。另一个亮点是经过重制的“战地门户”,它允许玩家设计自己的游戏模式并个性化定制战场。战役与场景单人战役将玩家带往世界各地的标志性地点。从撒哈拉沙漠的坦克大战到保卫纽约抵御入侵者,该战役呈现了丰富多样的战争场景。玩家将扮演一名海军突击队员,肩负着拯救世界免于崩溃的重任。首批反响与评价《战地6》的首批评价大多积极。尤其是全新的破坏机制和更紧凑的枪战体验备受赞誉。一位玩家表示:“地图非常庞大,而且新的破坏物理效果确实影响了游戏玩法,而不仅仅是视觉效果。”不过,也有批评声音指出偶尔出现的帧率下降以及某些武器的平衡性问题。未来展望随着第二赛季的临近,Battlefield Studios计划推出大量更新和调整,以进一步优化游戏体验。这包括对目前被视为“死亡陷阱”的载具进行改进。该系列的粉丝们可以期待更多内容和优化,这些更新有望使《战地6》成为该系列中最好的现代题材作品之一。常见问题《战地6》提供了哪些新模式?除了经典模式外,《战地6》还引入了“占领高地”、“统治”和“运送”等快节奏游戏模式。《战地6》采用什么技术?该游戏采用寒霜引擎,支持跨平台游玩,但不支持 Steam Deck。《战地6》计划何时发布?《战地6》已于2025年10月10日发布。

《使命召唤》不再敢让游戏变得艰辛而费力——而这一点在《现代战争4》中必须急需改变!

射击游戏专家 丹尼尔 坚信,将重心放在尽可能轻松舒适的刷级体验上是一个巨大的错误。自2019年的《现代战争》以来,《使命召唤》一直面临一个巨大的问题:它拆除了太多门槛、陷阱和障碍,导致游戏变得千篇一律,最终变得乏味。因此,2026年,Infinity Ward必须紧急打造一款敢于让人感到沮丧的《使命召唤》!大家预测一下《现代战争4》什么时候发售 我押9月22日 pic.twitter.com/lxEu2zlNHE — TDAWG (@tdawgsmitty) 2026年4月12日昔日的乐趣当人们眼中闪烁着怀旧的光芒,大谈特谈《使命召唤》在那个美好旧时光里是多么棒时,他们真正想表达的是: 《使命召唤》过去既令人抓狂,又令人沮丧,还充满不公。这一切从地图设计就开始了:当时并没有为电子竞技量身定制的三路设计。不,那些地图充满了有利位置、险恶的死角和身临其境的细节。那是战场,而不是竞技场。有些地图完全为狙击手量身打造,给狙击手提供了明显的优势。在某些地图上,如果没有霰弹枪或冲锋枪,根本就别想上场。这些地图模仿了真实地点,给人以身临其境的感觉。在这些《使命召唤》中,你不仅要对抗其他玩家,在某种程度上还要对抗地图本身——例如争夺有利位置的控制权。当年如果我在一场对局中被彻底碾压,那并非(仅仅)因为对手射击技术更强——而是因为他们更好地利用并掌控了地图。2019年的《现代战争》重启版正是将这一点带了回来。并因此遭到了猛烈抨击。部分批评确实有理,因为某些地图过于开阔,严重破坏了游戏节奏。但:Infinity Ward显然试图在此重现具有灵魂与个性的地图。许多玩家的主流观点是:如果看不到地面,那肯定就是游戏设计的错。对于一些粉丝乃至开发者而言,这一点显然已成定局: 未来游戏必须只聚焦于“玩家对玩家”的战斗。只关注经过平衡的技能比拼。绝对的公平。没有诸如具有挑战性的地图设计、有限的资源或刺激的机制等令人烦躁的干扰因素。问题在于:正是因为(而非尽管有)这些干扰因素,CoD才曾如此有趣。至少从长远来看是这样。若只剩重复刷分如今人们仍在热议《现代战争19》(甚至在发售7年后,其玩家数量有时还能追平《战地6》),这清楚地表明,正是游戏中那些(刻意设置的!)困难以及设计中的独特性才至关重要。正因如此,我才能体验到冒险。正因如此,每一局比赛都略有不同。正因如此,我才学会了如何变得更好,而不是只是机械地刷分。征服真正的挑战是一个核心要素,但它正面临消失的风险,因为《使命召唤》在过去几年里把一切都打磨得过于平滑,以至于再也不会发生任何意料之外的事情了。每一局比赛不过是纯粹反应速度和瞄准能力的比拼。CoD正沦为Aimlabs的华丽翻版。长此以往,唯一剩下的只有:更多的刷分。刷高数据。更高的分数。更多的击杀。更多的解锁内容。https://www.youtube.com/watch?v=THk_7fKHcLo但《使命召唤》本应包含更多内容。我应该需要冒点风险。需要动脑。需要应对复杂的局面。与其抱怨并要求移除克莱莫地雷——毕竟它们本来就不公平,只适合那些愚蠢的蹲点玩家——玩家们更应该开发出应对这些地雷的方法和战术。《使命召唤》必须让人感到不适。正因为《现代战争19》如此令人不适,它(与所有后续作品不同)至今仍在玩家社区中被热议。没错,这甚至可以包括缩减小地图功能,让玩家终于能睁大眼睛、竖起耳朵,而不是只顾着追着红点跑。不管有多少网红为此气得跳脚。我们需要勇于面对严苛仅靠枪战和进度系统已无法支撑《使命召唤》系列。不再有引人入胜的讨论,没有值得体验的故事,只剩下无休止的刷级。无论每个赛季推出多少三条战线地图或新模式,这都会变得乏味。《现代战争4》预计将于2026年发布。我最大的希望是,Infinity Ward能将那种沙盒式的特质带回来——这种特质在近年来被打磨得光滑无瑕、毫无摩擦的设计中惨遭埋没,以至于在我脑海中,最近六部《使命召唤》早已混成了一团毫无特色的糊状物。但要实现这一点,还需要有开发者敢于迎接这一挑战,并勇于再次制作一款艰辛、不公平且令人筋疲力尽的《使命召唤》。一款不盲从那些被部分玩家社区死守的僵化规则的游戏——在那里,任何偏离“电竞黄金标准”或不是为了快速升级而设计的无脑射击内容,都会立刻被视为巨大的失误。战斗终于必须再次让人感觉像是真正的枪战。这其中也包括不可预测的局面。还包括那些并非完全以100%公平性为标准进行平衡的武器和装备。还包括设计大胆、尺寸各异、风格多样的地图,在这些地图上,某些位置的战术优势确实比其他位置更明显。《现代战争4》必须重现真正的个性。但真正的个性也需要保留其棱角。我坚信:《现代战争4》只有敢于再次为我们带来昔日《使命召唤》时代那种真实的起起落落,才能取得成功。就像《现代战争19》曾经做到的那样。