1.3 C
Berlin
星期二, 30 12 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《极限竞速:地平线6》:系列变更与新发行策略

《极限竞速:地平线6》是该赛车游戏系列的下一部作品,将于2026年发售。在发售之前,该游戏就已显露出一个重大变化。这是该系列首次不会长期独占Xbox游戏机。相反,该游戏将在其他平台发售之前,进行限时独占发售。 此举恰逢 Xbox 发布策略发生明显变化之际。Forza Horizon 系列在此过程中扮演着特殊的角色。 Xbox 产品组合中最稳定的系列之一 自第一部作品问世以来,该系列已成为 Xbox 产品线的重要组成部分。迄今为止,该系列五部作品均获得了至少 85 分的 Metacritic 评分。最近三部作品甚至获得了 90 分以上的评分。因此,该系列成为 Xbox 产品组合中最稳定的品牌之一。 在Xbox因游戏数量和质量受到批评的时候,Forza Horizon 总是被认为是个例外。该系列游戏始终获得高评价,在品牌中占据着特殊地位。 Playground Games...

《堡垒之夜》在 2025 年继续发展:新模式、新内容和新结构

2025 年,《堡垒之夜》经历了许多变化。Epic Games 进一步扩展了游戏,引入了新模式、新内容和新系统。 这些发展既涉及核心产品,也涉及创意内容、化妆品和技术可用性等相关领域。到年底,《堡垒之夜》的业务范围比以前更广了。 《堡垒之夜》生态系统的扩展 早在 2023 年底, Epic Games 就同时发布了多种新游戏模式,包括《堡垒之夜》节、火箭竞赛和乐高堡垒之夜。在随后的几年里,这些产品不断得到补充,但并没有一个模式成为明显的焦点。相反,新内容不断被添加进来。 与此同时,《堡垒之夜》创意领域也在不断发展。2025 年,“偷脑子”成为首款拥有长期高玩家数量的创意地图。该模式基于一个获得许可的概念,其使用率有时可与大逃杀模式相媲美。 Epic 还宣布,创作者将来可以在他们的岛屿中整合使用 V-Bucks 的游戏内交易。 重返移动平台 另一个影响覆盖范围的因素是,许多地区再次可以在移动设备上玩《堡垒之夜》了。在法律方面取得成功后,该游戏重新回到了相应的平台。这大大增加了潜在的用户群。 此外,还引入了新的装饰物品。除了已知的车辆和乐器等类别外,2025 年还增加了所谓的“副手”。这些是跟随玩家参加比赛的同伴。与之前的扩展相比,这些新的装饰物品获得了更高的接受度。 大逃杀游戏产品的碎片化 在这一年中,Epic 在经典的大逃杀游戏基础上增加了多个独立版本。其中包括一个永久性的 OG 模式,该模式恢复了第 1 章的内容,并拥有自己的战斗通行证。此外,还有短赛制的闪电皇室模式和带语音聊天功能的限时周末模式——Delulu。 除了这些变体之外,重装模式仍然可用。尽管选项众多,但所有模式仍然拥有足够的玩家数量。没有报告出现匹配问题。 知名合作与音乐内容 2025 年,《堡垒之夜》音乐节发展成一个音乐合作平台。除了该模式的头条人物外,还与 Deadmau5、Daft...

《爱与深空2025》如何成为病毒式传播现象

在2025年Gamescom游戏展上,不仅在宏伟的展台前排起了长队,在一个相对不起眼的展台前也排起了长队。粉丝们在那里耐心等待着与《爱与深空》的纸板立牌合影。这张照片象征着这款手机游戏在一年中取得的成就。 一款影响范围非同寻常的乙女游戏 《爱与深空》是一款叙事性的免费手机游戏。它由 Papergames 工作室开发,该工作室此前以《Nikki》系列而闻名。该游戏于 2024 年 1 月发布,并在 2025 年的 Gamescom 游戏展上荣获最佳手机游戏奖。 根据公布的数字,该游戏在两年内通过玩家消费实现了超过 7.5 亿美元的总收入。与此同时,该游戏还培养了一批国际化的粉丝群体。 融合了爱情、科幻和动作元素 从内容上看,这款游戏融合了多种类型。剧情发生在一个科幻场景中,游戏角色是一个保护地球免受外星威胁的组织的一员。故事章节之间穿插着浪漫情节、3D 动作战斗和小型迷你游戏。 游戏的核心是五个可浪漫化的角色: 泽维尔、拉法耶尔、泽恩、西卢斯和卡莱布。他们每个人都有一个明确的原型,并拥有自己独特的个性。玩家可以有针对性地与各个角色相处,而不必拘泥于固定的路线。 亲密感作为游戏的核心元素 作为一款实时服务游戏,《爱与深空》将不断扩展。新互动方式是游戏的核心概念。通过菜单,玩家可以直接与角色对话、接触或通过麦克风与角色交谈。此外,还有专门强调亲密感和亲密度的音频内容作为补充。 这些机制有助于玩家建立长期联系。这些角色与其说是经典的游戏角色,不如说是游戏中的永久伴侣。 门槛低,市场不断增长 成功的一个关键因素是门槛较低。玩家只需要一部存储空间足够的智能手机即可。同时,该游戏还受益于西方市场对抽卡模式日益接受,这种模式在过去几年里通过其他手机游戏得以确立。 此外,长期以来,明显以女性观众为目标的游戏一直处于供不应求的状态。因此,《爱与深空》进入了一个对新形式持开放态度的环境。 超越游戏的粉丝文化 该游戏的受欢迎程度不仅体现在销售额或下载量上。在 TikTok 和 Bluesky 等平台上,粉丝们进行了活跃的交流。粉丝们讨论角色、语音、活动或特别困难的游戏环节。 该游戏经常被比作男孩乐队粉丝群的动态。他们的可见度增强了共同的热情。该游戏不仅被消费,而且被集体体验。