3.3 C
Berlin
星期五, 5 12 月, 2025

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

《杀手》仍然是我们旗下的旗舰产品——尽管有007,IO Interactive 仍未放弃 47 号特工

一个身处两个世界之间的工作室——以及一个不会消失的偶像 当一家历史悠久的工作室突然接管一个全新的品牌时,粉丝们会立即开始猜测。IO Interactive 也不例外: 自从《007:第一道曙光》发布以来,人们一直在猜测这对《杀手》的未来意味着什么。毕竟,47 号特工二十多年来一直是该公司的形象代言人,这个角色为该公司带来了巨大的成功。 随着邦德项目的启动,丹麦人终于踏入了很久以来从未涉足的新领域。但在开发工作加速推进的同时,人们对于《杀手》是否就此结束却感到困惑。与 Variety的深入访谈终于揭开了谜底——事实证明,这两个系列比许多人想象的要紧密地交织在一起。 “《杀手》是我们的核心产品”:为什么 007 并不意味着结束 IO Interactive 首席执行官 Hakan Abrak 在《Variety》杂志的采访中直言不讳地说: “《杀手》一直是我们的旗舰产品——将来也会如此。”  这句话应该让全球粉丝们松了一口气。虽然目前的工作重点是《007:第一道曙光》,但开发商们并不认为这是对《杀手》的替代,而是对其创作范围的扩展。 阿布拉克强调,他们为邦德所做的工作使许多以前在《杀手》世界里似乎无法想象的事情成为可能。据阿布拉克称,他们为007开发的技术系统将在长期内回流到他们的自家系列中。特别有趣的是:47号特工的成功实际上为邦德项目铺平了道路,而不是相反。 与此同时,团队已经在努力改进现有的《刺杀世界》。合作模式是首要任务。 阿布拉克认为,这将开辟一个全新的游戏层面,能够扩展和丰富精确的潜行游戏玩法。这些尝试又帮助工作室更好地理解《杀手4》可能的样子——尽管目前尚未透露任何具体信息。 邦德之后,《杀手4》即将到来:粉丝们真正的期待 但最重要的消息出现在采访的第二部分: 杀手4不仅可能推出,而且已经确定计划推出——但 在邦德系列之后。IO Interactive 明确表示,在进入 47 号特工的新时代之前,他们首先要完成《007:第一道曙光》的开发。 开发人员清楚地知道社区的期望是多么多样化。一些粉丝希望看到彻底的革新,而另一些粉丝则希望回归早期版本的开放式沙盒地图。Abrak 谈到了“许多强烈的意见”,但也谈到了团队对迄今为止的三部曲感到非常自豪。该三部曲中的许多内容直接促成了邦德项目——在邦德项目完成后,这些内容又将回流到《杀手》中。 在此之前,IO Interactive 不会让《杀手》蒙尘。刺客世界平台将继续维护,包括邀请知名嘉宾参与。最近的一个例子是说唱传奇人物阿姆,他与李小龙等其他偶像人物一起,为游戏增添了活力。此类活动不仅让社区保持活跃,还表明《杀手》对工作室仍然具有重要意义。

“我们已经达到了一个新的水平”——为什么《赛博朋克2077》的多人游戏突然比以往任何时候都更真实了

“结果超出了所有人的预期”——一次让粉丝们兴奋不已的测试 十人团队完成了 AAA 工作室未完成的工作 这个雄心勃勃的项目背后是一个由十人组成的模组制作团队,他们几个月来一直在努力打造一个稳定的《赛博朋克2077》多人游戏版本。他们的目标非常远大,要打造一个功能齐全的在线组件,支持 PvP 射击、大型竞赛和最多 20 人同时游戏。虽然主游戏中的任务将被排除在外,但玩家可以建立自己的服务器——这种做法让人想起 2000 年代早期的 PC 社区项目。 Beta 测试令人印象深刻 最近,CyberMP 举办了一场大型的游戏测试。测试内容包括稳定性、新游戏模式,尤其是游戏角色的同步性——这对任何多人游戏体验来说都是至关重要的。测试结果出人意料地令人兴奋。在 YouTube 上发布的视频下,团队写道: “结果超出了所有人的预期。这次测试可以说是该项目历史上最成功的一次。”官方 Discord 频道也表现得异常乐观:“在测试期间,只记录到几起客户端崩溃事件。所有游戏错误都将被修复或已经修复。我们相信,我们已经达到了一个新的水平。” “一个新的水平”——这个里程碑的真正意义 夜城因社区而焕发新活力——多亏了社区 一个拥有上千名员工的工作室最终放弃了,而一个模组团队却取得了成功,这充分说明《赛博朋克》社区对游戏的支持依然非常热情。自从广受好评的DLC《幻影自由》和大型 2.0...

“我们的发展速度比许多人想象的要快——为什么 CD Projekt Red 现在为《巫师 4》投入了大量资金”

在游戏界谈论宏伟计划时,一个名字几乎总是立即浮现在人们脑海中: CD Projekt Red。这家工作室既经历过巨大的成功,也经历过严重的危机——并由此发展出了几乎传奇般的韧性。当整个行业正在经历削减开支和取消项目的痛苦时期时,这家波兰公司却采取了一种出人意料的应对策略。 2025 年第三季度的最新财报不仅显示了收入的增长,还显示了另一件事: CD Projekt Red 正在升级——而且态度非常坚定。 这既涉及《巫师 4》 ,也涉及《赛博朋克 2》,这两款游戏已经激发了社区的想象力。但这些数字背后远不止是简单的统计数据。这是对一家工作室未来的展望,它正在以创纪录的速度准备其下一个世界。 《赛博朋克》疯狂热销——一切突然都加快了脚步 “118%——且没有结束的迹象?” 如果有人认为《赛博朋克 2077》的热潮早已消退,那就大错特错了。根据季度报告,该游戏及其扩展包《幻影自由》的销量比去年同期增长了 118%。这种增长甚至让行业分析师都感到惊讶。 许多人将这种增长归功于 Switch 2 版本,该版本自发布以来已成为新的销售动力。该集团的总收入达到 3.49 亿兹罗提(毛额),增长了 53%。这显然在该公司引发了连锁反应。 与此同时,该品牌新作品的开发团队也在迅速壮大: 《赛博朋克 2》的开发人员从 116 人增加到...