9.5 C
Berlin
星期四, 28 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《巫师3:狂猎》将推出新DLC内容和更新

CD Projekt Red宣布,作为最负盛名的角色扮演游戏之一,《巫师3:狂猎》将推出新的DLC内容和更新。这一消息发布之际,正值游戏迎来十周年纪念,且仍拥有大批热情的玩家群体。未来内容与猜测尽管 CD Projekt Red 尚未公布关于即将推出的具体内容的细节,但粉丝们推测,这些扩展内容可能包含新的任务以及额外的游戏机制。社区中已经就这些新内容可能对长期的游戏体验产生何种影响展开了热烈讨论。开发者评论与期待CD Projekt Red的一位发言人表示:“我们很高兴能延续《巫师3》的传奇,并为玩家带来新的冒险。” 这一声明彰显了开发团队持续支持并扩展游戏的承诺,即便在《赛博朋克2077》等新作发布之后亦是如此。未来更新展望粉丝们对即将到来的更新充满期待,希望这些更新能进一步深化《巫师3》原本就已复杂而丰富的世界。尽管确切的发布日期尚未公布,但预计近期将有更多信息和官方公告发布。常见问题《巫师3》的新DLC包含哪些内容?目前尚未公布新DLC的具体细节。不过有猜测称,它们可能会包含新的任务和游戏机制。《巫师3》的更新何时发布?新内容的具体发布日期尚未公布。《巫师3》还会继续获得支持吗?是的,CD Projekt Red已确认将继续为《巫师3》提供内容和更新。

“等待是值得的”:《Paralives》历经七年终于开启抢先体验,玩家们对此爱不释手

这款生活模拟游戏已开启抢先体验,Steam上的首批评测反响颇为积极。2026年5月25日,《Paralives》正式开启抢先体验,粉丝们为此等待了相当长的一段时间。历经七年的开发,生活模拟游戏爱好者们现在终于可以亲自体验这款《模拟人生》的劲敌了。我们为您梳理了社区中的首批反响。先透露一点:《Paralives》的前景一片光明。亮眼的数据与更精彩的评论一如既往,我们先从数据说起。截至本文发布时,《Paralives》在 Steam 上已收获超过 3,800 条评价在 Steam上积累了超过 3,800 条评论,并凭借88% 的好评率获得了“极佳”的认证标签玩家数量同样不容小觑。据SteamDB 数据显示,《Paralives》在发售当天达到了78,603名同时在线玩家的峰值。这些数据能否在未来几天保持下去,还有待观察。但如此强劲的开局无疑是利好消息,浏览一下玩家评论也让人充满希望。受好评之处:艺术风格与整体“氛围”:Paralives 充满诚意,已实装的功能在许多人看来都经过深思熟虑且精心设计。开放世界:许多玩家在《模拟人生4》中感到缺失的元素,在此作中表现得令人信服。开放世界运行基本流畅,设计精良。建造模式:作为生活模拟游戏最重要的支柱之一,该模式操作直观,自由放置功能为富有创造力的人提供了无限可能。日常生活中的角色扮演机制:Paras 会在一天中做出各种决定,并每天追求新的目标。 Steam 用户simka3002写道 “目前仅开放建造模式——即使游戏玩法平平,光是这个建造模式就值得购买!”Steam用户anniemaeherring写道: “在生了两个孩子、搬了五次家以及等待了七年之后,Paralives绝对值得等待。从这款游戏中可以明显看出,它是真正热爱生活模拟游戏的人开发的。对细节的执着、角色个性、自由度以及游戏的魅力简直令人难以置信。从建造温馨的房子到那些微小却如此真实的日常瞬间——你能感受到开发者们将全部心血都倾注到了这款游戏中!«评论请点击此处:平衡性:部分玩家认为技能学习速度过快或过于随意。Bug:经常出现小故障,例如显示错误。少数玩家报告了涉及角色编辑器、建造模式或工作窗口的重大错误。内容过少:部分玩家认为游戏中的玩法过于有限。特别是在实时模式下,游戏体验显得过于单薄。 Steam用户Apokryph写道: “某些方面的平衡性需要改进,例如在睡眠期间随机习得技能的能力——这个想法很酷,但感觉一夜之间就能成为万事通。”Steam用户lunogi写道:“一进城问题就接踵而至。 自己的角色和周围的人显得非常漫无目的,如果没有玩家的干预,他们几乎什么都不做。游戏玩法相当缺乏生机。«大多数玩家都清楚,对于《Paralives》这样的生活模拟游戏来说,处于抢先体验阶段意味着什么。一些小...

《绝地求生》现在要举办一场真人版大逃杀,但预告片让人很难把它当真

《绝地求生:刺激战场》将大逃杀改编成了一档在巴厘岛拍摄的真人秀。《烈火试炼》的首支预告片虽然表现得非常严肃,却显得有些滑稽。《绝地求生》将推出一档真人秀节目,以真实的大逃杀形式,由真人参与,在真实的岛屿上进行。当然,这里的“真实”并非指:100人从飞机上跳下,用煎锅互相殴打,并逃离不断收缩的死亡区域。但足够真实的是,16支队伍将飞往巴厘岛,在竞技场中争夺所谓的“荣耀之焰”。不过,首支预告片给人的感觉并不像是又一个大型娱乐节目正在诞生。倒更像是有人把RTL电视台的《丛林营地》和帕德博恩地区储蓄银行的夏季庆典扔进了同一个搅拌机里。预告片可是很认真的《烈火试炼》最搞笑的地方甚至不是这个创意本身: 将大逃杀游戏改编成真人秀竞赛,听起来其实并不离谱。《忍者战队》、《野兽游戏》和《武藏城》早已证明,人们乐于观看他人参与或多或少有些滑稽的游戏并最终失败。关键在于,整个节目被呈现得何等严肃且毫无戏谑之意。在预告片中,参赛者们穿行于热带场景,驾驶全地形车,沿着海滩奔跑,并用NERF枪互相瞄准。背景配有惯常的史诗级音乐、戏剧性的剪辑,以及一种仿佛即将有人重新定义娱乐未来的语气:其中,期望值与实际关注度之间的反差尤为耐人寻味:大约24小时后,该 预告片的浏览量仅为78次。也许我们根本就不是目标受众尽管如此,也不应完全忽视《Trial of Fire》:虽然《绝地求生》已不再像2017年和2018年那样作为大逃杀游戏的绝对霸主引发热潮,但该品牌在智能手机平台上的影响力依然巨大。特别是在印度、缅甸、印度尼西亚或菲律宾等新兴市场,移动游戏的作用远比许多西方国家更为显著。因此,《Trial of Fire》或许正是在这些地区触动了观众的敏感神经,而从德国视角来看,这种节目很快会被视为《丛林营》式的垃圾电视,但在其他市场却完全可能成为热门事件。不过,预告片还是让人很难相信这一点。也许5月30日起在YouTube上播出的完整节目,会比第一印象所显示的更有趣。但目前看来,这主要是一个试图营造出非常硬核风格的节目,尽管最终不过是一群人拿着玩具枪在巴厘岛上奔跑罢了。