30.4 C
Berlin
星期六, 20 6 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

在《GTA 6》发售当天,一家公司决定暂停运营,否则员工们恐怕都会请病假

为《侠盗猎车手6》放假?这听起来像是纯粹的一厢情愿,但现在有一家公司却为全体员工付诸实施了。《GTA 6》将于2026年11月19日发售。这原本只是一个再普通不过的星期四,对大多数人来说也是个工作日——这恐怕会让不少游戏迷感到纠结,尤其是当无法请假的时候。不过,Burger Motorsports公司显然注意到,许多员工因此坐立难安,于是果断决定,将《GTA 6》定为公司文化活动.据新闻网站Pubity on X报道,公司全体员工将在当天放假.快讯:《GTA 6》的预购日期现已确定。从下周起,大家就可以预购主机版的《侠盗猎车手6》了!全员放假,专心玩《GTA 6》由于太多员工请假,整家公司将在《GTA 6》发售当天暂停运营。Burger Motorsports 将此称为“史无前例的文化盛事”,并决定直接让全体员工在11月19日放假,而不是强迫他们上班。pic.twitter.com/yMzc7nFid3 — Pubity (@pubity) 2026年6月18日该条X平台帖子中展示了一份6月11日的内部通知,收件对象为Burger Motorsports的员工和合作伙伴。通知中解释称,公司发现11月19日当天将出现大量日程冲突。由于部分员工似乎已告知当天无法联系,或者干脆身处Vice City,公司决定果断处理此事,并以幽默的态度看待整件事。因此,作为小小的让步,大家都可以休息一天。一旦员工们完成了首次探索之旅或至少一项任务,并逐渐回归现实,工作将照常进行。在这篇X平台帖子中,可以看到一份日期为6月11日的内部通知,该通知是发给Burger Motorsports的员工和合作伙伴的。通知中说明,公司发现11月19日当天将出现大量日程冲突。由于部分员工表示当天无法联系,或者干脆身在罪恶都市,公司决定果断处理此事,并以幽默的态度看待整件事。因此,作为小小的让步,所有员工都将获得一天的休假。待员工们完成首次探索之旅或至少一项任务,并逐渐回归现实后,正常工作将随即恢复。游戏发售日竟成了节日?但X上的评论并不认为这仅仅是对员工的让步。例如,iGrandTheftAuto.com写道:这是个精明的营销噱头。他们无疑借此获得了想要的关注。但放一天假有什么意义?如果我是员工,我绝不会在完成100%进度之前回来。其他人则没那么愤世嫉俗,他们和公司一样,用幽默的态度看待这种荒诞的局面。例如,用户Duba评论道:照这样下去,《GTA 6》迟早会被当作一个节日来对待。JohnFallout...

《虚幻现状 2026》:三分钟速览Epic主题演讲的所有重要信息

在《虚幻现状》大会上,Epic Games不仅展示了少量UE6内容,还介绍了Unreal Engine 5.8的若干系统。《虚幻现状 2026》大会已圆满落幕,这场持续两个多小时的盛会为Epic软件的未来描绘了蓝图。除了对虚幻引擎6进行了一段相对简短的介绍外,开发者们还重点探讨了(可能是)最后一次重大更新——虚幻引擎5.8。下面我们将通过快速回顾,向大家展示本次主题演讲中所有重要的新公告。虚幻引擎 6:大致时间表已确定关于虚幻引擎 6,Epic Games 已确认其路线图:据 Epic 首席执行官蒂姆·斯威尼(Tim Sweeney)透露,下一代引擎将把 UE5 与《堡垒之夜》中并行开发的管道进行融合——采用 Verse 编程模型、可移植内容的开放标准,并通过 MCP 实现更深入的 AI...

回合制策略与飞船建造:《Down with the Ship》的Steam试玩版让我玩了12小时后,我绝对得给开发者付15欧元

免费、内容出乎意料地丰富且品质上乘:《Down with the Ship》的试玩版是Steam上真正的隐藏好物。有时你会“只是随便看看”地下载一个试玩版,想看看大家在GlobalESportNews的评论区里都在热议什么——结果三小时后你还坐在那里,感觉已经是第十次把等离子发射器向左移动一个像素了,因为这样它就能碰到两个反应堆,而不是一个。《Down with the Ship》(在 Steam 上查看游戏)时,我正是这样做的。而且我对此毫无悔意。这到底是什么游戏?玩法很简单:这款由 Iron Anchor Games 开发的游戏是一款自动战斗游戏,你需要亲手组装自己的飞船,装满各种小玩意儿,然后派它去与其他玩家的飞船战斗。每轮游戏,商店都会推出新的部件: 炮塔、反应堆、船员、诅咒遗物以及各种奇奇怪怪的东西。你根据当前需求进行购买,一点一点地将飞船改装成一座空中要塞。其中最关键的是部件的定位:部件安装的位置决定了它能否正常运作,因为模块的效果取决于邻近关系和连接方式。如果一门火炮紧贴在正确的反应堆旁边,其射速会突然翻倍。效果会连锁反应,加成会叠加,同一个部件根据放置位置的不同,甚至可能催生截然不同的战术策略。当所有部件终于就位后,点击“战斗”按钮,将控制权交出——战斗将自动进行。因此,所有的紧张感都源于一个问题:你的构造是否在前期就设计得足够精妙。战斗是与真实玩家保存的舰船进行的,且采用异步模式。所以,你永远不会对抗AI虚拟对手,而是始终面对其他玩家那些狡猾的构思。船长与阵营每次新通关前,你们都会选择一位船长,这为游戏带来了更多变化。每位船长都拥有不同的船体形状、独特的被动技能以及各异的培养路线。船长始终隶属于四大阵营之一:这些阵营拥有各自的装备池和独特风格——有的侧重纯粹的火力输出,有的则专注于持续性伤害效果。你可以完全依赖某个阵营的装备,这种策略非常可靠,因为这些部件之间相互协调,加成效果也相互叠加。或者,你可以尝试混合其他阵营的部件,打造出难以预测的组合。虽然可能会失败,但也可能产生出无人能预见的超强连招。试玩版值得一试吗?当然值得!这款免费试玩版提供了令人惊叹的丰富内容:十二位船长中的三位,各自拥有独特的布局和专属技能118件可试用的道具——来自完整版游戏中超过200件的道具对战模式,你将对抗其他玩家建造的战舰,并在生命值耗尽前争取取得10场胜利 “无尽模式”,在取得10场胜利后,你将持续战斗,直到船体彻底解体此外,你并非在某个与世隔绝的试玩“泡沫”中独自游玩,而是直接与正式版玩家在同一个游戏生态系统中一较高下。一款能让你直接投入排名匹配的试玩版——这实属罕见,也让人更难放下游戏。这些内容足以让你轻松消磨好几个夜晚——而我的问题恰恰就出在这里。每次通关后我都会想:“算了,我不买了,我肯定很快就会玩腻的。”——但随后我还是会一遍又一遍地重新开始玩。现在我真的欠独立开发商 Iron Anchor Games 那15欧元了——最迟在即将到来的...