18 C
Berlin
星期二, 19 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

巴德·斯宾塞遇上约翰·特拉沃尔塔:我新发现的Steam私藏好物,打得对手满地找牙

迪斯科与痛快殴打:久违的最佳游戏组合!我平时其实不太喜欢纯粹的格斗游戏。虽然我很喜欢动作或角色扮演游戏里精彩的打斗场面,但经典的横版格斗游戏之类的东西倒不是我的菜。所以当我在 Steam 的新发售列表中看到《Dead as Disco》时,起初还觉得无聊,直接滑了过去。没有多少剧情、只有刺耳音效的格斗游戏?不,谢了!况且我手头还没玩完的游戏已经太多了。但随后,我的“无肉辣椒”出现了。伴着洗脑神曲的晚餐或者更准确地说:我的烹饪副业。因为当我站在厨房里,看着土豆、扁豆等食材在锅里煨煮时,我掏出手机,在TikTok上无止境地刷着视频。除了那些号称20分钟就能做好的常规食谱(实际上总是花更长时间),我还刷到了Dead as Disco的视频片段。就在我看着那个穿着俗气骷髅头皮夹克的帅哥——就像随着林肯公园乐队《The Emptiness Machine》的节奏将成群的敌人打得落花流水时,我的脚不由自主地跟着节奏打起了拍子。再来一段视频。这次是瑞奇·马丁的《Livin La Vida Loca》。我又再次目不转睛地盯着屏幕直到视频结束。即使那盘“无肉辣椒”早已落入胃中,这首歌依然在我脑海中萦绕不去。所以晚饭后,我又回到电脑前,打开了Steam。在那里,我终于浏览了一下之前的Steam评论,着实大吃一惊。惊人的93%的好评!还有试玩版哦。唉,现在我们就在这里。舞池里的巴德·斯宾塞风格《Dead as Disco》确实像 Steam 和 TikTok 上展示的那样棒。你将扮演查理·迪斯科。一位前音乐巨星,他的乐队伙伴们冷酷地排挤了他(甚至可能杀了他?),而他现在正打算用一记“拳头三明治”向他们复仇。通过反击、闪避和连击,我在各种BOSS战中脱颖而出。其中,时机把握尤为关键。与机械地狂按按键不同,每一下攻击——尤其是在高难度关卡中——都必须经过深思熟虑,因为尽管我出招的威力堪比“蒸汽锤”传奇布德·斯宾塞本人,但我的承受能力却远不及他。不过,我的移动方式却像《周末狂热》里的约翰·特拉沃尔塔在舞池中翩翩起舞,以至于每位K-pop明星都能从我身上学到一两招。随着关卡进程中不断发生的场景切换,这种氛围感尤为突出。不妨亲自看看:顺便说一句,请原谅我这次只玩简单难度。普通模式的难度可是相当高,所以我不想在大家面前太丢脸!双拳加几项升级,欢呼吧由于《Dead as...

Steam新上架:蝙蝠侠、战锤、极限竞速——本周对你的钱包来说可不妙

本周Steam带来了多款大作、值得关注的精品游戏,以及大量赛车、策略和合作游戏的新内容,满足各类玩家的需求。本周的 Steam 可不会放过你的闲暇时光:从大作、XCOM 风格的战斗、合作射击、剧情角色扮演游戏,到一些相当独特的独立创意,这次几乎能满足所有人的口味。没错,甚至还有一款回归之作,恐怕没多少人会料到。一如既往,我们将为您展示本周最令人期待的 Steam 新作。没错,这次您的愿望清单可能会再次变长一些。快速导航本周亮点:《极限竞速:地平线 6》本周其他精彩 Steam 新作5月18日,星期一 5月19日,星期二 5月20日,星期三 5月21日,星期四 5月22日,星期五 本周亮点:《极限竞速:地平线6》(类型: 竞速游戏 -开发商: Playground Games -发行:2026年5月19日...

暴雪就《守望先锋》十周年争议发表评论

《守望先锋》迎来十周年纪念,但遗憾的是,此次活动并未获得粉丝的积极反响,这促使游戏总监发表评论,说明暴雪将在未来几周内如何解决这些问题。过去几天,随着《守望先锋》十周年庆典因令人失望的奖励和内容匮乏而蒙上阴影,玩家的不满情绪日益高涨。《守望先锋》总监承诺对十周年庆典活动进行调整大家好。我们一直在关注大家本周对周年庆活动的反馈,这些意见都很中肯。《守望先锋》十周年是一个重要的里程碑,我们希望这一整年都能充满对《守望先锋》的庆祝氛围。 1/8— Aaron Keller (@aaronkellerOW) 2026年5月15日玩家的强烈反对已促使《守望先锋》游戏总监亚伦·凯勒(Aaron Keller)通过社交媒体回应争议,并详细说明暴雪将如何弥补玩家的失望。亚伦·凯勒在推特上表示,针对《守望先锋》十周年活动的批评是合理的,奖励不应仅限于战利品箱。作为补救措施,暴雪将在第二周将社区战利品箱的数量增加一倍,第三周则增加至三倍,同时将解锁全部战利品箱所需的对局数降低至60场。此外,在第三周,玩家将获得一个“十周年纪念宝箱”,内含4件传奇皮肤,这意味着玩家在活动期间总共可获得10件传奇皮肤。展望未来,凯勒表示暴雪将在今年晚些时候为《守望先锋》带来更多内容,团队正着眼于全年的规划,这可能暗示着未来将有更大、更好的奖励。然而,似乎相当一部分《守望先锋》玩家认为这仍显不足。中国的《守望先锋》玩家则享受着截然不同的十周年庆典活动,包括可获得神话碎片作为登录奖励,甚至还能通过登录奖励最多获得10款神话皮肤。毋庸置疑,全球各地的《守望先锋》玩家都觉得自己错过了更丰厚的活动,并质疑为何当前的活动不能与中国版一样。更何况,与《漫威对决》一周年庆典推出新模式、大量皮肤及货币奖励相比,《守望先锋》玩家觉得这对于十周年庆典而言依然显得相当寒酸。不过,《守望先锋》总能将船舵转向正确的方向。暴雪已一再证明,尽管历经争议与种种挫折,这款游戏总能从玩家数量的低谷中强势反弹;若不知何时该调整方向,它也不可能坚持十年之久。令人沮丧的是,本应成为社区庆典的《守望先锋》十周年活动,却因种种原因变得如此令人失望。