5.3 C
Berlin
星期六, 13 12 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《Into the Fire》将成为近年来最不寻常的生存游戏,我已经立即将其加入了我的愿望清单。

和许多人一样,直到最近我才听说《Into the Fire》这款游戏。在观看了游戏玩法视频,并与开发人员进行了独家访谈后,我希望这款游戏能成为生存游戏中的亮点。 火对我们来说,一直既迷人又可怕:一方面,它是可靠的光源、热源和能源;另一方面,它又是一种破坏力,吞噬一切。 也许正是这种原始的魅力,让我对《Into the Fire》的截图产生了浓厚的兴趣:明亮的红色和黄色的熔岩流吞噬了其他的一切,吞噬了整个村庄。我们身处其中,与火焰搏斗。但《烈火》不仅外观精美,还拥有绝妙而独特的想法! 《Into the Fire》的独特之处在哪里? 开发人员为他们的游戏创造了一个独特的类型名称:灾难性事件救援生存。我们的任务是在一场毁灭性的火山爆发后,从看似无望的困境中拯救人类和动物。 我们从燃烧的废墟中将他们救出,用水枪开道,或用斧头破门而入。然后,我们将被救人员转移到我们的车辆上,将他们送到安全的基地。 因此,《Into the Fire》并不完全属于任何一种类型,而专门创造的术语非常合理:该游戏将抽取射击游戏和生存游戏的元素融合成一种完全独特的模式。开发人员向我们详细解释了这种模式是如何运作的: 我们的基地是枢纽: 在这里,我们存放物品,并与我们认识或救过的人交谈。我们选择装备,然后出发去执行选定的救援任务。 在时间压力下拯救生命: 一旦开始任务,我们就不能浪费时间。因为我们要进入越来越致命的灾区。火焰和熔岩流不断蔓延,我们只能暂时遏制它们。建筑物坍塌,新的危险出现。如果我们花太多时间,就会被大火包围,无望获救。 每项任务所需的装备: 我们的游戏风格取决于所选的工具,但我们可以随时在车辆上调整这些工具。我们装备了消防斧、扫描仪、水枪、泡沫弹或灭火枪。利用收集到的资源,我们制作了新的工具、更好的防护服或更大的水箱。 自然灾害和超自然现象: 但火灾并不是唯一的危险。随着火山爆发,火灵也出现在地面,威胁着我们的救援任务。但它们也容易被水消灭。 故事和结局:《火中救援》还讲述了我们所拯救的人们的故事。根据我们在关键时刻的决定,故事会有不同的结局。 其他任务类型: 除了常规的救援任务外,还有危险性较低的搜索任务,我们可以在这些任务中专注于寻找人员和收集物品。而在寺庙里,则有战斗任务等着我们。 灭火模拟、不断变化的关卡和与火灵的战斗?《Into the Fire》似乎真的会是一款非常独特的混合游戏。你们很快就能亲自体验这款游戏的精彩之处了。游戏测试即将开始,你们可以通过  Discord服务器进行注册。 这款生存游戏预计将于 2026 年春季在 Steam 上以抢先体验版的形式发布,内容约为 20 个小时。开发者计划与社区一起花费大约一年时间继续开发《Into the...

你们最喜欢的游戏在其中吗?列出了所有凭借新技术在配备合适的 Radeon 显卡时看起来比以前更漂亮的标题。

AMD 已正式发布 FSR Redstone,除了新功能外,还公布了将在年底前支持这些功能的游戏列表。但细则也很重要。 2025 年 12 月 10 日,AMD 兑现了其承诺,发布了名为“Redstone”的新功能包。该功能包部分是对已知的 FSR 功能的改进,部分则是全新的创意。但 Redstone 功能包中的四个组件都有一个共同点:它们都以某种形式依赖于人工智能。AMD 承诺,该功能将带来更好的图像质量和更高的帧率。到今年年底,将有 200 多个游戏受益于 Redstone——但并非所有游戏都能获得所有功能。 四项 FSR...

《战地风云6》的新补丁引发了人们的激烈讨论:以下是目前最大的4个争议点。

随着1.1.3.0版本的巨型更新,《战地风云6》不仅获得了新地图,还进行了巨大的改变。这些改变正在引发许多讨论。 这应该是圣诞假期前的最后一次重大更新——更重要的是:这是《战地风云6》正在朝着正确方向前进的有力声明。刚刚发布的 1.1.3.0 更新补丁说明比储蓄银行的网上银行合同还要长,几页纸的调整、修复和改进,旨在消除社区的所有小问题。 但正如西班牙人常说的:应该、应该、自行车链。新补丁确实解决了许多问题,但也带来了新的问题,并做出了一些值得商榷的决定。粉丝们的反应也各不相同。有些人感到失望,有些人感到乐观,还有些人则介于两者之间。我们为您梳理了四个最具争议的更改。 1. 地图的变化 先说好消息:布鲁克林地图的新冬季版本相当受欢迎。地图本身散发出美丽的冬季氛围;与之相匹配的游戏模式也玩得很爽快。在雪地版本中,只有站在燃烧的垃圾桶附近,才能自动恢复生命值。这给征服和占领模式带来了有趣的新变化。虽然不是什么惊天动地的变革,但确实是一个非常酷的新增功能。 游戏中最大的地图建设项目“突破”的情况则完全不同。自发布以来,整个突破模式都存在平衡问题,因为地图边界非常狭窄,导致比赛非常单调且一边倒。 新补丁将显著增强突破模式中的进攻方实力,为其提供额外的装甲车等装备。许多粉丝认为,这恰恰将情况推向了另一个极端。进攻方获胜的次数过多。这个 Reddit 讨论帖以讽刺的方式指出了这个问题——他们还不如直接把防守方的武器收走: 突破——不应该允许防守队员使用枪支 作者:u/Merlins_beard420 来源:Battlefield6 2. 错误、性能和崩溃 许多玩家对补丁后的技术状况感到不满。有大量关于微卡顿、崩溃、菜单损坏和其他错误的报告。我们也可以证实这一切:在三轮《战地6》游戏中,我们遇到了两次崩溃和一次游戏错误,导致我们无法重生。实际上,我们不得不三次退出游戏。三场比赛中。<blockquote class="reddit-embed-bq" data-embed-theme=“dark” style="height:500px" data-embed-created=“2025-12-12T19:48:55Z”& gt;这绝对是游戏史上最糟糕的更新之一。 作者:u/tonismann 在Battlefield6 Dice...