7.6 C
Berlin
星期四, 7 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《Subnautica 2》:发售日期、平台、多人模式、Game Pass 及其他——关于这款生存冒险游戏的全部资讯

《Subnautica 2》即将开启抢先体验。我们为您汇总了价格、合作模式、平台等所有信息,一目了然。《Subnautica 2》在正式发售前便已历经波折。随着发行商与开发商之间的法律纠纷得以解决,现在已没有任何障碍阻碍其开启抢先体验。我们将为您汇总关于本作发售的所有重要信息。快速导航:发售:《Subnautica 2》何时发售? 平台:《Subnautica 2》将在哪些平台发售? 价格:《Subnautica 2》售价多少?Game Pass:《Subnautica 2》会登陆 Xbox 订阅服务吗?系统要求:玩《Subnautica 2》需要什么配置?剧情:《Subnautica 2》讲的是什么? 游戏玩法:《Subnautica 2》怎么玩? 多人模式:《Subnautica 2》的多人模式是什么样的? 发售与抢先体验:《Subnautica...

《地狱潜行者2》:社区对PSN事件的失望程度已达近期之最

《地狱潜行者2》的玩家们目前对开发商Arrowhead颇为不满。原因在于新机甲的设计以及补丁的处理方式。自2026年4月28日起,《地狱潜行者2》推出了新的战争债券。正如Exo Experts这个名称所暗示的,这涉及新的机甲。也就是战斗机器人,玩家将借助它们给虫族、机器人和章鱼族制造麻烦。但这款新战争债券反响平平,Steam评分也出现了明显下滑。此前当官方决定允许玩家使用PlayStation账号在Steam上畅玩《地狱潜行者2》时,也曾引发过类似的舆论风波。当时Arrowhead迅速改口,但当前的问题比2024年5月时要轻微得多。机甲的问题这两款新的战斗机甲并非《地狱潜行者2》中首见的同类机甲。不过,之前的机甲以及其他载具均未作为战利品(Warbond)的一部分,因此——至少在玩家看来——并未设置10欧元的付费壁垒。这一批评在Warbond在Steam上的公告中便已出现,甚至引发了论坛帖子呼吁抵制。Reddit上还有类似帖子,批评游戏首次通过战债(Warbond)获取载具的做法。注:解锁所需的游戏内货币“超级积分”既可在商店购买,也可在游戏中赚取。当然,后者需要花费大量时间。此外,包括发起上述抵制呼吁的 Steam 用户在内的一些玩家认为, 针对新战争债券的补丁突然对此前过于弱小的机甲进行了强化。RenYi写道:“他们制造问题,然后兜售解决方案。”Steam 评分下滑回顾上周的Steam 评价,可见在过去一周内,近 6,000 条评价中仅有22 条好评。按照该平台的评级标准,这属于“多为负面”的范畴。即使将范围扩大到最近30天,Helldivers 2的正面评价率也仅为42%。但就绝对数字而言,这远不及PSN那场灾难般的情况。当时Steam上累计收到了近23万条负面评价。

《Deine Mudda》正在Steam特卖中(目前用户好评率超过90%)

《Deine Mudda》目前在Steam上打折,这证明了即便是最垃圾的游戏,总能找到它的受众。《你妈》在DSF上拉卡车。「你妈太胖了,想碾过她,碾到一半还得去加油。」对于这次短暂的2000年代初校园生活之旅,我们深表歉意。毕竟“你妈”梗完全不好笑,而且老掉牙(就像你妈一样)。但这种复古的尴尬感其实有非常现实的缘由:因为如果你正在浏览 Steam 的特价商品,迟早会发现:《你妈》正在打折。而且这是认真的。这款游戏Deine Mudda目前正以超低价出售,玩家社区对此欢呼雀跃。为你的桌面准备的虚拟母亲替代品这个荒诞的标题背后,隐藏着一款桌面伴侣:Deine Mudda 完全如其名所示:它会在你的屏幕上放置一位虚拟的动漫女性,陪你上网、工作或打游戏。据 M for Mother 工作室的开发者称,该程序旨在用母爱与温柔包围你。你可以用鼠标与这个角色互动,她的视线会追随你的光标,而且据描述,你甚至能从她那里学到新语言。据开发者称,你的虚拟妈妈甚至可以通过互联网拜访你Steam好友的母亲,一起度过难忘的时光。如果你还想在屏幕上看到更多变化:Steam创意工坊提供了海量的模组支持,如果你想下载属于你自己的梦想母亲的话。《你的老妈》让 Steam 社区乐翻天不过,《你的老妈》真正的娱乐价值并不在于游戏本身,而在于 Steam 上那些绝妙的用户评价。社区对这样的绝佳素材可是欣然接受。我们为您精选了其中一些最有趣的评论,这些评论的积极率甚至高达94%:“工业革命及其后果对人类来说是一场灾难。” –查理扎德爵士, “花0.99欧元,你妈真是稳如磐石。” –Yoshi “我特别喜欢玩任何以战争为主题的游戏,然后在背景中听到‘你赢了吗,小子?’。我的一生都在为这一刻而努力。”–Shido...