-2.3 C
Berlin
星期六, 31 1 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

FC 27 将采用开放世界?泄密消息揭示了 EA Sports 对《FIFA》后续作品的意外计划

EA Sports 计划为 FC 27 打造一个开放世界,现在该游戏模式似乎也有了名字。 足球最明显的规则之一就是限制比赛场地。但 EA Sports 现在似乎故意打破常规,想在《FC 27》中为玩家提供一个开放的游戏世界。 早在 2025 年,就有传言称 Electronic Arts 正在打造一个开放世界,其灵感可能来自 NBA 2K 的《The City》或...

《Code Vein 2》全球发售:各地区发售时间一览表

《Code Vein 2》即将全球发售。万代南梦宫已经确定了全球发售日期,游戏将在同一时间发售,但根据时区不同,发售时间也会有所不同。玩家可以在 Steam 和发行商的官方商店购买该游戏。 《Code Vein》的续作将在统一时间发布。决定因素不是具体国家,而是当地时区。 全球发布日期确定 《Code Vein 2》将于 1 月 29 日在全球范围内发售。发售时间为太平洋标准时间 15:00。从该时间起,所有支持的平台都将提供下载,除非您已提前解锁游戏。 该游戏将在所有平台上同时发布。Steam 和 Bandai Namco 官方商店之间没有区别。 各区域发布时间 由于全球同步发布,不同区域的当地时间会有所不同。以下区域将按以下时间发布: 洛杉矶:1 月 29...

Critical Role:一个小小的互动可能会让当前战役中一位英雄的阶级焕发出全新的光彩。

对于第四次战役中的某些英雄来说,他们选择的子阶级仍然是个谜。粉丝们认为他们已经揭开了这个谜底。 Critical Role 目前第四次也是规模最大的战役的第一章已经结束,但 13 名活跃玩家和游戏主持人并没有休息。该团体分为三派:探索者、士兵和阴谋家。 第 12 集已经播出,以利亚姆·奥布莱恩饰演的角色哈兰迪尔·方(Halandil Fang)对过去充满情感的回忆开场。一些粉丝注意到了一个重要的细节。以下内容包含第 12 集的轻微剧透。 哈尔属于哪个吟游诗人学校? 哈尔这个角色是一个吟游诗人。虽然一些英雄已经透露了自己的次要职业(或揭示了自己的真正主要职业),但利亚姆·奥布莱恩饰演的热爱戏剧的兽人仍然将自己的专业作为秘密。 Reddit 用户 ErraticNymph 认为自己已经解开了这个谜团。他猜测哈尔属于雄辩学派,而不是许多人猜测的哀伤学派。 在上述的闪回场景中,哈尔试图安抚哭泣的女儿赫罗,为此他需要进行一次说服力掷骰。由于这是闪回场景,奥布莱恩想知道游戏主持人是否也认为他在过去已经达到 3 级。 ErraticNymph 确信他提出这个问题是因为他想知道自己能否将雄辩学校的一项技能应用到他的掷骰中。该技能名为“银舌”,可使玩家将任何低于 9 的说服力掷骰结果视为 10。 对于粉丝来说,这个吟游诗人学院更适合哈尔,因为他属于阴谋集团。他们认为,一个专注于社交互动的学院更合理。 掷骰结果可能证实了这一猜测 假设这里遵循标准的 DnD...