14.7 C
Berlin
星期三, 3 6 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

“我们正在重新定义个人电脑”:英伟达的下一个重磅之作是对英特尔、苹果和AMD的直接挑战

英伟达在Computex展会上推出了RTX Spark平台,旨在为人工智能时代重新定义个人电脑。几十年来,PC硬件市场的权力格局似乎已成定局——但这一根基如今可能面临动摇。在Computex硬件展上通过YouTube直播的主题演讲中,英伟达CEO黄仁勋展示了全新“RTX Spark”平台,由此向行业巨头英特尔、苹果和AMD发起了正面进攻。得益于与ARM、联发科和微软的合作,这家AI巨头开发了一款超级芯片,旨在按照英伟达的愿景,将个人电脑重新定位到AI时代。N1X芯片:向苹果发出的挑战书其中关键在于新平台的核心:N1X超级芯片。此前,英特尔和AMD一直主导着Windows PC的内部架构,而英伟达则专注于显卡领域。英伟达与芯片专家联发科合作,开发了一款基于ARM架构的20核CPU,并将其与Blackwell图形单元直接融合在单一芯片上。该芯片预计将提供多达6,144个CUDA核心和1 petaflop的AI性能。此外还配备了128GB的共享内存。其结果是一款非常类似于苹果M系列芯片的系统,但额外具备英伟达的AI性能,并完全集成到微软的Windows生态系统中。然而,尽管Windows迄今为止几乎完全针对AMD锐龙系列或英特尔酷睿处理器等x86架构处理器进行优化,但Nvidia的这款超级芯片必须采用ARM版本的操作系统。英伟达对该芯片的性能描述如下:借助 OptiX 和 DLSS,用户可以渲染高达 90 GB 的超大规模 3D 场景, 使用NVIDIA Blackwell解码器处理4:2:2格式的12K视频,运行拥有1200亿参数和100万令牌上下文的大型语言模型,并以1440p分辨率、每秒超过100帧的帧率,在支持光线追踪、DLSS和Reflex技术的情况下畅玩AAA级游戏。在PC制造商的支持方面,Nvidia给出了更具体的说明。随着新平台的推出,几乎所有大型PC制造商,包括戴尔、华硕和微星,都在开发相应的设备。据Nvidia称,首批设备预计将于今年秋季起在零售商货架上亮相。不仅仅是“普通”笔记本电脑:重点聚焦于AI代理Nvidia的愿景远不止于传统笔记本电脑,因为该平台是专门为代理式AI开发的。黄仁勋展示的产品包括微型无风扇台式电脑,旨在全天候在后台完全静音运行。它们将作为家庭或办公室的智能指挥中心,完全无需昂贵的AI云订阅服务。其背后的理念是:未来,用户无需再亲自点击Word、Adobe Photoshop或3D软件中的无数菜单。取而代之的是,一个AI代理将在设备本地运行。用户只需向代理设定目标——例如根据粗略草图设计房屋——代理便会自主打开所需程序,生成模型并自行修正错误。人类将从操作者转变为监督者。由于这些流程不容许任何延迟,因此必须在本地进行计算——这正是英伟达(Nvidia)目前提供的硬件所针对的领域。更多相关内容:一个时代的终结:英伟达在20年后最终移除了这款历史悠久的工具黄仁勋表示,未来的个人电脑将不再像传统的工作设备那样,而更像一个自主助手,其运作方式类似于《星球大战》中的R2-D2或C3PO机器人。不过,独立的性能测试和价格信息尚未公布。此外,一个特别引人关注的问题是:搭载ARM芯片的Windows体验,究竟能有多接近我们长期以来使用x86处理器所熟悉的体验。

Steam新动态:一款角色扮演游戏将引发强烈情感——而这正是它如此危险的原因

本周对Steam玩家来说将充满情感波动:《哥特王朝1》重制版即将登场,这或许会成为本年度最受瞩目的RPG作品,但我们建议大家保持谨慎。六月一开场,Steam就带来了一款重磅大作,这是许多玩家多年来翘首以盼的。除了这款传奇角色扮演游戏的回归,本周还有许多其他新作等待着大家。我们为您总结了本周最重要的PC新游戏。快速导航本周亮点:《哥特王朝1》重制版本周其他值得关注的 Steam 新作6月1日,星期一2026年6月2日,星期二 2026年6月4日,星期四2026年6月5日,星期五本周亮点:《哥特王朝1》重制版类型: 角色扮演 |开发商: Alkimia Interactive |发售日期: 2026年6月5日 (Steam)在德国,能让人瞬间产生如此强烈情感共鸣的角色扮演游戏寥寥无几,因为对于你们中的许多人来说,原版《哥特》承载着一段青春记忆。正因如此,这款重制版将引发巨大的情感波动——最好的情况是热情高涨,最坏的情况则是赤裸裸的愤怒。先说好消息:这款《哥特王朝》重制版旨在保留许多让原作至今仍如此特别的元素。Alkimia 承诺将打造一个手工构建的开放世界、更精心设计的任务线以及现代化战斗系统,同时不会过度磨平《哥特王朝》那粗犷的核心特质。如果能做到这一点,这或许真的不仅仅是一次美好的怀旧之旅。但这份期待可能会很快变成失望:我们直到上周末才拿到评测密钥。经验告诉我们,这绝非好兆头,可能意味着开发团队正在最后一刻火速修复 Bug、性能和技术问题。因此,在考虑购买前,最好先看看我们的评测——除非对你们来说,Bug 也是《哥特王朝》真实体验的一部分。本周其他精彩Steam新游6月1日星期一Arcane Merchant:在这款轻松惬意的模拟游戏中,你将在一个中世纪奇幻世界中开设自己的魔法商店。出售治疗药水和宝剑,扩展你的业务,轻松成为城里最富有的商人。2026年6月2日星期二《战列舰指挥官》(抢先体验): 这款由 MicroProse 推出的硬核模拟游戏将让你以第一人称视角置身于二战时期“沙恩霍斯特”号战列舰的舰桥,负责操控雷达、导航和火炮系统。Hobby Horse(抢先体验):一款奇思妙想的“竞速模拟”游戏,你可以在其中定制自己的木马,并在障碍赛道上奔跑和跳跃。Fatekeeper(抢先体验):THQ...

《哥特王朝》重制版的评测何时发布?还请大家再稍作等待

这款角色扮演游戏的重制版将于2026年6月5日发售。我们将在游戏发售时才为大家带来评测——并分阶段发布。科里尼斯,我们来了!《哥特王朝》重制版距离发售仅剩几天,经过多次延期后,现已确定于2026年6月5日正式推出。这就引出了大家最关心的问题:嘿,GlobalESportNews,你们的评测到底什么时候发布?让我们带大家一窥编辑部的幕后情况,并分享我们目前的计划。耐心等待,直至发售前夕最重要的事实:截至目前,我们尚未收到评测密钥。因此,我们目前无法游玩《哥特式》重制版的正式发售版本,自然也无法进行测试。我们目前获得的预览版仍存在一些技术缺陷,据开发者称这些缺陷将得到修复。但最重要的是,该版本仅包含游戏的一小部分内容,沼泽、新营地、兽人领地及其他区域完全无法进入。因此它不适合用于我们的评测。关于该预览版的所有内容,请参见此处:因此,只有在收到激活码后,我们的测试流程才能正式启动。若现在快速浏览一下日历,便会立刻明白:距离游戏发布已所剩无几,更何况我们无论多么热切,都必须遵守劳动法规定。而周末以及6月4日的法定节假日,更是给我们的时间安排雪上加霜。我们预计评测禁令将在发售前夕或发售当天解除。因此,我们目前预计流程如下:在发售日,即6月5日,我们的测试人员将根据截至当时的游戏体验,为大家带来第一印象。这样,你们在游戏刚上线时就能获得初步的购买建议。随后,我们将对游戏的其余部分进行全面但高效的测试。我们的最终评分预计将在游戏发售后的那一周公布。目前我们还无法给出确切的日期。谁负责为各位测试这款游戏?GlobalESportNews的主力测试员是Steffi,Kevin担任副手。当然,其他编辑部成员也会参与测试阶段,或为各位准备精彩的后续文章,例如Heiko、Tillmann和Fabiano。此外,我们还与视频团队保持着密切合作,其中Jonas负责《哥特王朝》的相关内容。我们还与GamePro团队保持着紧密合作。众多同仁正齐心协力,致力于为大家呈现一份全面的评测报告。我们深知,对于你们中的许多人来说,《哥特王朝》远不止是一款重制版角色扮演游戏。《哥特王朝》与 GlobalESportNews 社区之间有着一段长达 25 年的特殊情缘。对我们中的许多人而言,初代《哥特王朝》也是深植于心的游戏,它对我们产生了深远的影响。因此,我们不会为了在谷歌搜索排名中抢得微弱优势而仓促发布评测。相反,我们将花时间深入探索游戏的每个角落,包括“老矿场”的每个角落,体验三大阵营,当然也会对新内容进行细致入微的考察。正如你们理应期待的那样,也正如《哥特王朝》系列理应展现的那样。我们和你们一样迫不及待,终于要揭开新旧矿谷之谜了。在上一期预览之后,我们抱有谨慎的乐观态度,但一些关键问题依然悬而未决:角色和怪物的AI是否会进一步优化?攀爬、烹饪以及改进后的潜水等新元素将如何融入整体体验?最终章节是否会得到合理的改进和扩展?感谢大家的耐心等待。我们很快就会在殖民地与大家见面。