6.6 C
Berlin
星期六, 7 3 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

目前最出色的提取射击游戏即将迎来重大变革:《猎杀对决》揭开《恶魔踪迹》的神秘面纱

新活动《恶魔踪迹》将带来一些重大变化,为游戏注入新的活力。 《Hunt Showdown 1896》本身就是市场上最刺激的提取射击游戏之一。Crytek 通过定期举办活动不断颠覆既定的模式——现在,《Devil's Trail》即将到来,这个新赛季可能会对游戏流程产生根本性的影响! 探索与追踪 Hunt 的开发人员事先就独家透露,他们正在开发新的侦察机制。惊喜的是:现在它们已经问世了!Devil's Trail 注重探索和追踪,因此地图上的补给点和提取点现在都隐藏起来了。 要找到这些地点,您必须亲自前往,或者: 找到一座新的侦察塔,并在那里与地图进行互动 击杀一个BOSS,或从已经击杀的BOSS身上拾取赏金代币 焚烧一张“战车”塔罗牌(该牌会交换现有的提取点) 因此,现在必须通过特定的行动来探索地图上的重要地点,这改变了比赛的动态。 许多新机制 此外,新的游戏元素将侧重于追踪敌人。其中包括: 新塔罗牌(女祭司): 在 30 秒内揭示下一个敌方猎人的位置。 新塔罗牌(探路者): 在有限的时间内,在整个地图上标记所有已使用的首领线索。 新特性(全神贯注):在黑暗视野中,您可以更好地定位敌方猎人(增强猎人的声音,抑制环境声音)。 新地点(侦察塔):  现在,每个任务都包含两个随机放置的塔楼——它们提供地图、塔罗牌和特性。 新地点(Burned Convoy): 新补给点(隐藏),提供稀有战利品,包括全耳特性。该地点如下图所示: 有烟必有火。🔥 pic.twitter.com/ouIGcmbxbJ — Hunt: Showdown (@HuntShowdown) 2026年3月2日 链接到 Twitter 内容 此外,玩家的行为现在会在开放世界中留下更多可见的痕迹,经验丰富的猎人可以解读这些痕迹。被杀死的动物会留下尸体,用过的弹药和急救箱以及门会半开着,爆炸的桶会留在原地。因此,睁大眼睛、竖起耳朵的人可以更好地根据敌人的活动来追踪他们。 Devil's...

《运输狂热3》告别了“印钞机路线”——你的决策将动态改变游戏世界

前几代游戏中,玩家们最不满的一点就是,他们不必再经营利润丰厚的路线——钱源源不断地涌来,挑战性大大降低。现在,这种情况将发生改变。 现实生活中很棒的事情,在游戏中却很快会变得无趣: 稳定的大额收入来源。在《运输狂热 3》的前两款游戏中,也存在这样的“印钞线路”。因为您很少需要调整特别赚钱的线路——一旦它们开始运转,就会持续地给您的账户带来收入,甚至持续数十年。 但现在,Urban Games 希望让世界变得更动态。你的居民和环境会对你的决策、车辆、建筑和线路规划做出更强烈的反应。即使你不干预,事情也会发生改变。 迪特尔推搡 一个简单的例子:居民们想去上班或购物。这会为每个角色单独模拟。如果迪特·D 想买水果,但你没有为他提供公交或电车等交通工具,他就会步行或开车去。如果迪特们人数众多,就会很快产生影响:交通拥堵、噪音、污染,你的营业额下降,迪特们会生气。这很正常! 但如果你能让迪特快速去购物,并为他的村庄提供所需的商品,那么村庄就会慢慢发展壮大。就像以前的版本一样。但现在,《运输狂热 3》中增加了更多影响增长的因素,包括: 交货时间 满意度 交通 噪音 污染 奖金,例如通过景点获得 例如,满意度取决于迪特是否需要长时间等待下一班公交车,以及乘车是否舒适。有顶棚的车站和舒适的巴士可以弥补漫长的等待和乘坐时间。 城市越大,交通越拥堵 如果你们工作做得很好,村庄就会逐步发展成大都市,而每一步都会带来新的挑战。这些挑战已经不像《纪元》游戏中那样只是对商品的需求了。而是越来越多的迪特们想要去越来越多的商店、工作地点和家。越来越多的工业需要你们提供材料,并生产商品,这些商品当然需要有人来取货。 因此,你们应该不断检查并调整已建立的线路。巴士可能已经无法满足迪特尔人的出行需求,因此需要电车或火车。Urban Games 在平衡方面做了很多工作,你们的干预应该相互衔接,产生可追溯的影响。 购物之都还是工业之都? 即使你们没有运送所有所需的产品,城市也会继续发展。不过,发展速度会比较慢。而且,非常酷的是:城市会根据你们的运送情况动态变化。如果你们专注于贸易商品,就会形成更多的商业区;相反,如果你们专注于工业产品,随着城市的发展,就会形成更多的新企业。 城市的声誉也取决于您的做法:如果您不断砍伐森林或拆除住宅,声誉就会受到影响。但作为补偿,您可以建造隔音墙、铺设树荫大道或将轨道迁至地下。 大亨网球 在游戏开始时,你需要建立自己的总部,并通过达成里程碑来进一步扩建。侧楼、游泳池和网球场不仅时尚,这些扩建还提供了切实的奖励。就像解锁的景点一样,比如灯塔、新天鹅堡或日本城堡。 为了避免新手感到不知所措,也让专业玩家大汗淋漓,《运输狂热 3》将提供许多个性化的设置选项,包括工业密度、生产力和维护成本。Urban Games 仍然不愿透露确切的发布日期,只表示将在 2026 年推出。

马拉松:第一季和第二季的路线图已公布,每次你们都会失去自己辛苦积累的一切

马拉松刚刚发布,但作为一款服务型游戏,它当然必须考虑未来的发展。Bungie 已经公布了许多信息。 众所周知,马拉松不是短跑,因此开发商 Bungie 也考虑到了未来的发展。虽然新射击游戏《马拉松》刚刚发布,但我们已经从开发商的博客文章中了解到,除了第一季之外,还有哪些新内容即将推出。以及整个赛季的进展情况。 首先,可能会有一个令人难以接受的消息:每个新赛季开始时,你的进度都会被重置为零。这已经在发布前的服务器测试中公布过,现在 Bungie 提供了更多细节。你获得的进度几乎会被完全清除。具体来说: 赛季结束时你会失去什么:你的全部装备、完成的所有派系任务、派系进度以及玩家等级。 你不会失去什么:你的装饰品以及派系的基本解锁。 服务器重置在《Extraction》射击游戏类型中并不新鲜,在《Escape from Tarkov》中已经存在多年。理想情况下,它们可以防止老玩家随着时间推移变得过于强大,以至于新玩家完全没有机会。 另一方面,《Hunt: Showdown》、《Arc Raiders》和《Arena Breakout》提供了其他平衡方案,无需重置即可实现同样的效果。或者至少使其成为可选方案。 除了重置之外,我们现在已经大致知道第 1 季和第 2 季会发生什么。 马拉松第一季的所有新内容 第一季的标题为“死亡是第一步”。该季为期三个月。除了基础游戏的首发内容外,您还将看到: 第四区 Cryo Archive,一个面向经验丰富的跑者的终极游戏区,这里竞争非常激烈。该区将在发布后立即上线。 排名模式将于 3 月下半月推出,为游戏增添了一个竞争性排行榜,您可以在其中解锁外观升级。 一个名为...