13.7 C
Berlin
星期二, 5 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

Steam新上架:超过100万玩家期待这款动作游戏黑马

我们将为您介绍本周Steam上的重要新作,其中包括一款拥有超过100万个愿望单的动作游戏黑马。本周的 Steam 新品周虽没有一款超级大作,但带来了一系列相当精彩的组合,涵盖动作、策略、合作角色扮演、战术射击以及一些妙趣横生的独立创意。和往常一样,我们将在本周一为大家介绍这些令人兴奋的新作。本周亮点:《Dead as Disco》 本周其他值得关注的 Steam 新作2026 年 5 月 4 日,星期一2026 年 5 月 5 日,星期二2026 年...

英伟达首席执行官认为,我们正处于一场新的工业革命之中,在这场革命中,人工智能不会取代我们,而是将对我们进行细致入微的控制

黄仁勋坚信,人工智能将创造更多就业机会。在当前关于工作未来的争论中,双方观点对立:批评者担心人工智能将导致大规模失业,而科技先驱们则宣扬一个丰裕的时代。在这场讨论中,英伟达首席执行官黄仁勋并未将人工智能视为人类的替代品,而是将其视为一种甚至会增加工作量的工具,正如他在斯坦福大学商学院的一次小组讨论中所提到的那样。黄的产业构想:将数据中心视为“代币工厂”黄认为,我们正在经历一场计算机技术的根本性变革。从传统的检索存储数据,转向持续生成新内容。在此背景下,他用一个具体的比喻来描述这种新基础设施:“数据中心已从文件存储演变为代币生成,我将其称为将电力转化为代币的工厂。”黄所描述的这一变革,将成为所谓“代理系统”的基础。根据他的设想,这些系统是人工智能助手,不再仅仅等待指令,而是能够自主控制流程,并在企业内部承担任务。另一面:当AI成为“微观管理者”乍听之下似乎减轻了负担,但黄用颇具挑衅性的措辞将其描述为工作压力的增加。他声称,AI代理不会取代人类,而是会通过不断提供辅助工作和提出疑问,让人应接不暇。“你的代理会不断催促你,干涉每一件琐事,而你却比以往任何时候都更加忙碌。”背后的逻辑:随着从构想到实施(例如通过自动化代码)之间的门槛降低,人们对人类创造力和决策能力的期望也随之提高。对黄仁勋而言,目标并非用更少的人完成同样的工作,而是用同样的人员实现产量的巨大增长。现实检验:市场数据与经济障碍黄仁勋的设想与当前的市场发展及专家观点形成鲜明对比,这些观点在相关报道中也有所提及。尽管英伟达首席执行官预测就业人数将增加,但调查结果却呈现出截然不同的景象:约44%的美国首席财务官计划在2026年因人工智能而裁员。此外,业界对这些“AI工厂”的效率也存在重大经济疑虑:高昂的运营成本:英伟达副总裁布莱恩·卡坦扎罗承认,目前AI模型所需的计算能力成本往往高于人力成本。财务风险:基思·李等分析师警告称,当前的AI订阅模式往往无法覆盖硬件和能源的巨额运营成本——这使得该技术目前对许多企业而言仍是一个“无底洞”。在政治层面,黄仁勋的愿景也遭到了批评:美国众议员罗·卡纳在同一场讨论中强调,需要实现“人工智能的民主化”。如果没有有针对性的政府干预和教育计划,生产率的提高很可能只会惠及一小部分精英,而广大劳动者则将面临就业不稳定和实际工资下降的风险。顺便一提:奥斯卡奖的转向:为何一年后AI内容仍被禁结论:一把双面刀黄仁勋将AI视为下一场工业革命,声称其最终创造的就业岗位将多于被淘汰的岗位。“这场工业革命结束时,就业人数将比开始时更多。”这一愿景能否实现,还是批评者所担忧的大规模裁员浪潮将占据上风,除了社会因素(如对人工智能技术的接受度)外,还将取决于能否成功控制巨额运营成本。在此之前,黄的“代理未来”主要意味着一件事:一个虽然不会失业,但“比以往任何时候都更忙碌”的工作世界的承诺。

《全面战争》:该系列中最具争议的游戏之一将在13年后再次迎来重大改版

Creative Assembly再次着手优化《罗马2》,并宣布了三项更新,这些更新将深度调整游戏机制并提升画面表现力。《全面战争:罗马2》是一款两极分化的游戏。部分粉丝认为该作是 Creative Assembly 的首次重大失败。毕竟游戏发售时存在数不胜数的 Bug,而且《全面战争》系列的经典玩法在此作中被大幅简化了。而另一些人则看到了其场景呈现的潜力、游戏的易上手性,并至今仍因此而喜爱这款游戏。正因如此,《罗马2》在发售13年后依然拥有惊人的玩家基数,这绝非偶然。正是后者,促使Creative Assembly决定为这款老牌策略游戏进行一次相当大刀阔斧的焕新改造。作为其历史系列大规模修复计划的一部分,《罗马2》将成为首款接受全面重制的游戏。在4月30日的直播中 中,详细解释了这对《罗马2》意味着什么。《罗马2》如何与时俱进三项重大更新将确保《罗马2》成为一款更出色的游戏,并能与现代标准相媲美。这些更新被统称为“万神殿更新”,因为每一项都对应罗马万神殿中的一位神祇。战神更新首个大型更新聚焦于《罗马2》的实时战斗。此处包含多项改进,旨在让战斗比以往更具战略性。护甲:将引入新的护甲减伤计算公式。这将带来更直观、更线性的游戏体验。此前,护甲的防护效果在很大程度上取决于随机因素,这一情况将有所改变。同时,穿甲伤害不再完全无视护甲值。总体而言,这将使装备护甲的单位更具韧性。士气与疲劳:为了避免战斗因此不必要地拖延,耐力和士气机制也进行了调整。现在,通过巧妙的侧翼机动,更容易瓦解敌方部队的士气。此外,疲劳对部队战斗效能的影响也更加显著。冲锋:配备长矛的单位现在可以完全阻止骑兵单位发起冲锋。此外,我们还调整了相关加成机制,使拥有良好冲锋防御能力的步兵获得优势。规模:单位的规模将变得更加显著。总体而言,这将使部队更具分量和冲击力。队形排列:不同部队的站位现已有所区分。纪律严明的部队会整齐列队,而较为杂乱的部队则会乱成一团。此举有助于在视觉上更好地区分各部队。AI:AI在战前部署军队时将做出更明智的决策。维纳斯更新第二次更新旨在优化《罗马2》的呈现效果,使游戏既更具现代感,又更具沉浸感。HUD:用户界面已进行调整,通过受罗马别墅启发的纹理,现在将营造出更浓郁的氛围。光照:世界地图和战斗中的光照效果均已重制并得到优化。纹理: 尤其是世界地图上的纹理得到了美化。这既适用于大陆,也适用于海洋。战斗中盾牌的破损效果也得到了优化。朱庇特更新第三次重大更新将深入调整战役地图上的游戏机制。主要目标是避免玩家在战役过程中像以往那样出现过于夸张的“滚雪球”效应。同时,游戏体验也将变得更加轻松自然、易于理解。全局加成:许多加成效果不再支持无限叠加,以避免某些机制在战役过程中变得冗余。建筑:更新后,游戏不再区分主城与支城。您可以在任意城市建造所有建筑链。我们全面重构了建筑的效果、影响强度以及建筑树的实际分支结构。帝国:帝国值不再限制可征召的军队数量。取而代之的是,您拥有的军事建筑能够提升这一上限。这样您就能更好地通过建筑来调控军队的效能。科技树:科技树将不再包含大量针对单元的微小增益,取而代之的是解锁完整的建筑或新的单位类型。这些内容何时上线?这三个更新目前均未确定具体上线时间。不过,所有更新都会先进行测试版测试。首先推出的是火星测试版,随后将加入金星,最后是木星。待所有功能运行正常后,万神殿更新将向所有玩家开放。因此,我们预计这些改动生效还需要几个月的时间。顺便提一下,未来仍将保留一个与当前游戏版本一致的《罗马2》版本。此举主要是为了避免所有模组都必须完全适配新版本。