13.5 C
Berlin
星期六, 13 6 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

我试玩了新作《古墓丽影:亚特兰蒂斯的遗产》,现在高兴得像个孩子一样

虽然《古墓丽影:亚特兰蒂斯的遗产》是该系列首作的重制版,但我们的试玩总结指出:它首先指向的是未来。哎,谁还能抱怨呢?在过去的几年里,全新的劳拉·克劳馥游戏比德国大城市的合理租金还难得一见,而现在我们不仅迎来了一款新的《古墓丽影》,甚至是一举两得!随着《古墓丽影:催化剂》的推出,一款宏大的续作即将登场,它不仅旨在延续最近的重启三部曲,还试图将之前的三部《传奇》游戏有机地串联起来。此外还有《古墓丽影:亚特兰蒂斯的遗产》。这款定于2027年发行的《古墓丽影》由Crystal Dynamics与Flying Wild Hog(《邪恶西部》、《暗影战士》)联合开发,肩负着一项崇高的使命: 为所有年轻人重现劳拉·克劳馥的起源故事——也就是该系列的第一部作品。对这些年轻人来说,1996年听起来比“去电影院看电影却不一直盯着手机”还要原始。但这里有一个问题。劳拉·克劳馥这些年来已经变了。在最近几部作品中,她的台词有时听起来就像一个Tumblr账号,而当年的老劳拉在酷炫程度上却能让任何冰块都黯然失色。那么,《亚特兰蒂斯的遗产》中的女主角是否必须牺牲自己的锋芒,以适应重启时代的新风格呢?在2026年夏季游戏节(Summer Game Fest)试玩了《古墓丽影:亚特兰蒂斯遗迹》后,我可以斩钉截铁地断言:不。一种别具一格的重制你们当中那些见多识广的鼩鼱们想必已经察觉到了:难道《古墓丽影》初代不是已经重制过一次了吗?没错,但《亚特兰蒂斯的遗产》与2007年的《古墓丽影:周年纪念版》有着截然不同的走向。这里并非像《合金装备:三角洲》或即将推出的《刺客信条:黑旗重制版》那样,追求原汁原味的重制。虽然《亚特兰蒂斯的遗产》以1996年的原版《古墓丽影》为蓝本,但它更将原作视为一种色彩调色板,以此创作出完全崭新的艺术作品。在我半小时的试玩环节中,我在秘鲁关卡就已经体验到了这一点。《亚特兰蒂斯的遗产》的开局对原版游戏的老玩家来说非常熟悉:铁血考古学家劳拉·克劳馥受企业总裁杰奎琳·纳特拉之邀,去打捞传说中亚特兰蒂斯的遗物。其中一件据说就藏在安第斯山脉维尔卡班巴的印加遗址中,因此游戏便直接从秘鲁开始。在整个试玩版中,劳拉尽显经典《古墓丽影》时代的魅力:她妙语连珠,由艾丽克斯·威尔顿·雷根以极具英伦风情的嗓音演绎;她不听任何人指手画脚,却既不显得幼稚,也不显得漠不关心。至少在试玩版中,开发团队完美地抓住了这个平衡点。“我见过的最精彩的游戏之一”新的秘鲁关卡与原版有一些大致的相似之处:劳拉必须与古老的石柱和水系互动以开启路径,而最终等待她的是一只霸王龙。不过,实现的方式却让人感觉焕然一新。在《古墓丽影1》(以及《周年纪念版》)中,关卡还像是在涂了秘鲁、希腊或埃及风格颜料的体育馆,里面的箱子、凸起和房间都显得不太自然;而在《亚特兰蒂斯的遗产》中,迎接我的却是一片令人屏息的风景,其中的一切都显得独一无二。我甚至敢断言:《亚特兰蒂斯遗迹》是我见过最美的游戏之一。当然,前作《古墓丽影:暗影》在画面表现上已经相当出色,但《亚特兰蒂斯》通过虚幻引擎5呈现出的华丽程度,可谓无与伦比。秘鲁的废墟被植物覆盖,岩石上的每一道裂缝都显得真实可信。远非拼图游戏因此,游戏玩法也远非拼图游戏。当然,劳拉·克劳馥的武器库在核心上依然非常熟悉,《古墓丽影:暗影》的设计风格几乎原封不动地延续了下来: 我需要攀爬、解谜,偶尔还要战斗。但《亚特兰蒂斯》的流程比原版流畅得多,因为我很少会连续两次重复相同的操作。例如,为了激活某个装置,我需要收集齿轮。第一个齿轮很容易拿到,只需用钩爪扯下一根木梁,就能露出战利品。要拿到第二个,我得操作一台古董水泵。而为了拿到第三个,我得攀爬一座巨大的瀑布,用镐头劈开茂密的植被,抓住临时搭建的横梁荡过深渊,最后仅凭纯粹的体力摧毁一个装置,让齿轮顺着瀑布漂下来。顺便提一下,游戏还引入了全新的技能系统:通过发现秘密,我将获得技能点,用来……解锁某些内容。演示版中该机制尚未启用,我猜这应该涉及制作和生命值加成。说到制作:和重启系列一样,劳拉会在周围环境中找到各种植物和资源,用来制作有用的……东西。不过除了生命值道具外,演示版在这方面依然相当保守。还有第三个“模糊”点:在选项中,我可以手动调整各种难度等级,包括谜题的难度。但我尚不清楚这会产生什么具体影响。根据描述文本,这主要涉及高难度下缺失的提示和界面提示。所以你们会注意到:开发者们还在保留许多真正的新机制,这次试玩体验仅能提供一个粗略的第一印象。说到“保留”二字:直到演示的最后才出现战斗。我觉得这很棒。正确的侧重点多年来,《古墓丽影》时不时地暗示自己更倾向于动作射击游戏,而非动作冒险游戏。毕竟《使命召唤》在2000年代曾大获成功,尤其是2013年的重启之作,部分内容甚至显得相当血腥。《亚特兰蒂斯的遗产》——至少从试玩版来看——似乎更贴近以解谜为主的初代作品。根据我的经验可以断言:当媒体试玩版90%的内容都是解谜和探索时,这确实是一种宣言(也是一种冒险),但在我的眼中,一款优秀的《古墓丽影》就应该如此!《亚特兰蒂斯的遗产》唤起了探索的魅力,以及发现隐藏在关卡各处的秘密的乐趣。画面很棒而且《亚特兰蒂斯的遗产》确实魅力十足。如果整个冒险在关卡设计、多样性和流畅度方面都能保持试玩版的水平,那么等待你们的不仅将是自《神秘海域4》或《古墓丽影:暗影》以来最出色的动作冒险游戏之一,也将是最精美的作品之一。对我来说,最大的疑问仍在于剧情:原版游戏除了那些酷炫的场景外,剧情内容简直少得可怜。2007年的首个重制版通过一个巧妙的安排解决了这一缺陷,将旧剧情与《古墓丽影:传奇》和《古墓丽影:地下世界》的宏大背景相结合,讲述了一个崭新且更宏大的故事。到目前为止,《亚特兰蒂斯的遗产》尚未显露出任何改观的迹象。首支预告片和试玩演示完全照搬了1996年的开局;如果纳特拉斯从第一秒起就显而易见的背叛,在2027年依然是整个故事中最令人惊讶的转折,那我几乎开始期待我的税务通知了,因为那肯定会带来更多刺激。不过,公平地说,我只瞄了一眼第一关,所以我的结论暂时还是乐观的:《亚特兰蒂斯遗迹》目前在各个方面都给人留下了绝佳的印象。作为《古墓丽影》的粉丝,这让我久违地感到如此开心。编辑部总结我必须坦白:在《亚特兰蒂斯遗迹》首次公布时,我感到有些失望。如果算上2024年的重制版,这已经是第四次让我重温劳拉·克劳馥的首次冒险了——嘿,我对初代《古墓丽影》没什么意见,但相比同样精彩的第二、第三和第四部,原版无论在剧情还是游戏设计上,都不配享有如此高的地位。当年《古墓丽影》初代确实很棒,但我个人其实更期待能重制第二、三或四代。试玩之后,我的看法改变了。一方面,《亚特兰蒂斯的遗产》并非简单复刻原作的关卡和游戏机制,而是在熟悉的框架下打造了一场全新的冒险。其次,没有什么题材比亚特兰蒂斯篇章更适合让劳拉·克劳馥回归其核心本色了。环游世界、探索、解谜、对抗远古怪兽—— 对于那些觉得劳拉在过去15年里偏离正轨太远的人来说,这里汇聚了让这个品牌大放异彩的所有优势。没有生硬嫁接的开放世界元素,没有对女主角那种自怨自艾式的“去神秘化”,更不是披着《古墓丽影》外衣的射击游戏。我绝非要贬低重启三部曲,毕竟它只是走了一条不同的路——而且走得非常、非常出色——但时隔多年,能再次体验到如此经典的劳拉·克劳馥,感觉真是太棒了。何况有了《催化剂》,我们也不必放弃真正的续作。

《上古卷轴6》终于再次传来官方消息——距离首支预告片发布已过去8年

几乎没有人比《上古卷轴》的粉丝们更需要展现出如此大的耐心了。该系列的下一部作品至今仍未公布发售日期,更别提正式的预告片了。不过,现在总算传来了一点动静。贝塞斯达今年将迎来多个纪念日:40年前贝塞斯达软件公司成立,而《上古卷轴5:天际》的发售也即将满15周年。此外,还有一个令人不那么愉快的日期: 就在8年前的2018年6月11日,《strong》系列新作《The Elder Scrolls 6》的首支预告片正式亮相。此后……便再无下文。自那以来,贝塞斯达提及这款《上古卷轴5:天际》续作的次数,用一只手就能数得过来。直到今天,依然没有新的预告片、确切的消息,甚至连发售日期都没有。如果不是已经正式公布过,《上古卷轴6》恐怕很快就会达到《半条命3》那样的“传说级”地位。不过,在游戏发布八周年之际,总算出现了一丝微弱的生命迹象。《上古卷轴6》依然存在在今年的夏季游戏节(Summer Game Fest)之前,粉丝们再次对《上古卷轴6》的公布抱有期待——但最终还是失望了。在一次采访中《Variety》因此询问了Xbox负责人马特·布蒂(Matt Booty),他如何应对粉丝的期待。布蒂回答道:我认为,像我这样职位最大的挑战之一,就是在“向全世界展示正在开发的所有酷炫内容”的愿望,与“尽早激发人们的热情”的愿望之间取得平衡——但我们也知道,我们需要等待恰当的时机。而且,一旦决定展示,就必须呈现出我们所能提供的最佳内容。当你展示游戏时,也就向大家许下了承诺:嘿,它很快就要来了。所以我可以告诉大家:我去了贝塞斯达,和托德 坐在一起,亲眼看到了《上古卷轴》的实机演示——画面非常棒,开发进展顺利。我们会确保在恰当的时机进行公告,并真正地揭开它的面纱。唉。看来我们又没得到什么新消息。Booty真正透露的唯一信息就是《上古卷轴6》的开发进展顺利。不过,Xbox高管在镜头前大概也不会说出其他内容来。至少:这位Xbox负责人似乎和Todd Howard持相似观点,不希望公布与发售之间间隔太久。因此,如果《上古卷轴6》在某个时候亮相,或许就像《辐射4》那样,距离发售也只剩几个月了。而像《上古卷轴4:湮没重制版》那样突然发布的情况则不太可能发生。但《上古卷轴6》的开发目前进展到什么程度了呢?目前关于这一点的线索寥寥无几:2023年8月,贝塞斯达确认前期制作已完成,正式开发已启动。2024年时,游戏的早期版本已经存在。直到今年,托德·霍华德才透露,这款《上古卷轴5:天际》的续作将使用新版Creation Engine引擎。贝塞斯达目前正全力投入新作《上古卷轴》的开发,而开发团队中的一小部分成员仍在忙于《星际战场》的制作。目前2028年被视为一个颇有可能性的发售年份,但我们恐怕还得在黑暗中摸索相当长一段时间。

《流放之路2》:终于会有剧情模式的替代玩法了吗?我们亲自向制作人求证

许多《流放之路2》玩家都希望终于能有剧情模式的替代玩法。我们向Grinding Gear Games询问了是否计划推出跳过主线的选项。你们中的许多人可能最喜欢《流放之路2》在剧情模式之后的内容:包括阿特拉斯、重制的终局机制以及build的优化。正因如此,一个问题屡遭诟病:想要玩新角色,每次都必须通关剧情。我们询问了 Grinding Gear Games,是否计划提供通往终局的替代升级路径。答案相当明确。社区希望有捷径在我们上一篇关于《流放之路2》的文章下,虽然整体氛围大多积极,但评论区中有一条批评反复出现:战役的长度及其强制性。特别是对于有家庭和工作责任的玩家来说,通往终局之路往往成为一场耐心的考验。以下是评论区中玩家们的部分反馈:marcel110891虽然热爱这款游戏,但作为一名有全职工作的父亲,他认为剧情模式的冗长实在令人沮丧。他期待能有办法跳过剧情,直接通过终局内容来升级。Panthe对此表示完全赞同。在玩了180小时后,他只进入过一次终局内容,因为他喜欢尝试新职业。至少对于副号来说,能跳过主线剧情会更好。Extrawurst已经通关了15多次,简直看腻了。尽管现在通关速度变快了,但这依然是一项枯燥的必做任务。El Cativo对此持不同意见。他认为,战役模式大约需要16小时的游戏时间,即使时间有限,花上几个晚上也能轻松完成。游戏总监如是说我们已将大家的担忧转达给开发团队,并收到了《流放之路2》游戏总监乔纳森·罗杰斯(Jonathan Rogers)的明确答复。那些曾希望像《暗黑破坏神4》那样通过纯粹的刷级来提升等级的玩家,现在恐怕要失望了。针对大家的批评,乔纳森·罗杰斯向我们解释道: “推进主线剧情是角色成长的重要组成部分,跳过剧情绝非我们的考量。” “此外,我们一直在优化主线剧情,以使其对熟悉游戏机制的现有玩家更加紧凑。在 0.5.0 版本更新中,我们进行了大量此类优化。」 「我们添加了许多有助于你们更轻松地找到物品的元素,并缩短了许多区域的流程,这显著降低了完成战役所需的平均时间。」 “此外,由于你们已经通过第一个角色找到了物品,因此在同一联赛中玩第二个角色会快得多。” 精简而非删除好消息是,Grinding Gear Games 至少已经注意到这个问题:但与其将剧情完全设为可选,Grinding Gear...