11.4 C
Berlin
星期一, 18 5 月, 2026

伊隆·马斯克(Elon Musk)宣布了“世界上最聪明的AI”,但事实并非如此简单

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

Grok 3 即将发布,但它不会像马斯克希望我们相信的那样令人惊叹。

每天都有大大小小的AI被宣布,每个AI都希望在各个领域超越其他AI。然而,这种情况通常只发生在某些基准测试或编程等更复杂的任务中。Jan认为,这对普通用户来说没什么区别。

尽管如此,埃隆·马斯克还是将他的人工智能公司xAI的新大型语言模型(LLM)Grok 3描述为世界上最聪明的AI。但这一说法的背后是什么?

埃隆·马斯克(Elon Musk)被认为是世界上最富有的人之一,但同时也是最具争议的人之一。他发表过恐同言论,并因反犹太主义而受到指责,因为他曾说犹太裔投资者乔治·索罗斯(George Soros) 憎恨人类,并对索罗斯抱有阴谋论,还讨论了他对言论自由的态度。

自马斯克收购推特(现为X)以来,关于该平台处理仇恨言论、假新闻和政治影响力的投诉日益增多。最近,马斯克还在X上亲自攻击了多位欧洲国家元首则积极干预德国联邦选举活动。在美国政治中,他被认为是特朗普的顾问,据说在新总统领导下担任新设立的流程优化办公室的职务。在特朗普于2025年1月宣誓就职后,马斯克在一次公开活动中做了一个被广泛认为是纳粹礼的手势。

最近他还多次干涉德国政治。例如,他在《世界报》上发表了一篇备受批评的客座文章,支持德国另类选择党(AfD),或为该党的总理候选人爱丽丝·魏德尔(Alice Weidel)在X上直播提供平台,并在此过程中多次发表不实言论。

Grok 3:内部

Musk和xAI的一些开发人员在X上直播了Grok 3。

根据马斯克的说法,人工智能应该可怕地聪明,聪明到令人恐惧。因此,据说Grok 3比ChatGPT-4o具有更好的逻辑结论、更强的计算能力和更高的适应性。

这意味着该模型计算速度更快,能够更精确地理解复杂关系,并且能够更灵活地应对不同的问题。

根据xAI的说法,Grok 3能够做到以下几点:

  • 据说,这款人工智能是在Colossus超级计算机(100,000个Nvidia H100 GPU)上训练出来的。
  • 据说,训练过程花费了2亿个GPU小时,是Grok 2的十倍。
  • 该模型使用人工生成的数据进行训练。这种合成数据旨在确保数据集的多样性和可控性,并减少隐私问题。
  • 开发人员使用了强化学习和强化学习,这是一种机器学习方法,模型根据奖励函数评估并改进其输出。
  • 此外,还应用了强化学习与人类反馈(RLHF):由真人对输出结果进行评估,以完善奖励函数,进一步提高人工智能内容的质量。
  • 语境训练旨在确保人工智能更好地理解并调整答案的语境。
  • LLM应该能够通过分析和比较答案与事实来纠正自己。
  • 深度搜索是一种高级研究和语言功能,将在稍后添加。

大目标:减少幻觉,提高逻辑准确性。

什么是幻觉?LLM中的幻觉是虚假或虚构的信息。这是所有常见聊天机器人的已知弱点,也是您应该始终质疑AI生成的答案的主要原因。

Grok 3 何时上市? 在美国,部分用户已经可以使用 Grok 3。首先面向付费用户(40 美元/月)。然而,具体的时间表尚未确定。

在欧盟和英国,Grok 3 暂时无法使用,因为 xAI 必须进行调整以符合欧盟法规。

Grok 3:世界上最聪明的 AI?

Grok 3 为何比其他 LLM 更胜一筹?根据 xAI 在直播中展示的基准测试,Grok 3 在数学、编程和科学问题等逻辑任务上尤其优于竞争对手。

然而,xAI 没有展示其他领域的基准测试——稍后会有更多内容。

即使Grok 3应该产生更少的幻觉,但这并不意味着这个目标已经实现。OpenAI还依赖于自我校正、合成数据和强化学习与人类反馈(RLHF)。

只有当独立用户能够测试它时,才能知道人工智能究竟有多好。

直播中的可疑言论

马斯克和他的团队的一些言论可能会产生误导或误导。这就是为什么我们要在这里讨论它们:;

终极求真的AI: 马斯克在直播中声称,Grok 3是终极求真的AI,有时会与政治正确相矛盾。很难说他是暗示其他开发者故意美化事实,还是积极寻求以不同的方式呈现事实或背景,抑或纯粹出于政治挑衅。

人工智能每天都在进步: 马斯克声称模型每天都在改进。如果这意味着细微的调整,那也没问题。然而,我们要明确的是,LLM的训练最终在发布前结束——之后只进行细微的调整。

显著的开发时间: 马斯克强调xAI在2023年才开始开发,而其他公司从2019年开始就一直在研究LLM。他没有提到真正的突破不在于开发时间,而在于海量的数据和计算能力。因此,对于财力雄厚的公司来说,快速开发自己的AI模型相对容易。

仅在三个领域进行基准测试:Grok 3在其他领域(如语言任务)的表现如何,目前尚不清楚。这是因为马斯克和他的团队只展示了逻辑任务的基准测试。

因此,世界上最聪明的AI这个称号与其说是可验证的事实,不如说是营销手段。至少马斯克和他的团队没有展示任何突破性的创新来证明这个最高级的称号。

即使目前Grok 3处于领先地位,但OpenAI、谷歌和Anthropic的新模型肯定已经在开发中了。

在2月11日至13日召开的世界政府峰会上,马斯克表示,这可能是其他人工智能超越Grok的最后一次机会。这还有待观察。

Stephan
Stephan
年齡: 25 出身:保加利 亞愛好:遊戲 職業:網上編輯器,學生

RELATED ARTICLES

“简直是一堆垃圾!”——20年前,许多玩家对Steam的看法截然不同

在当今的游戏领域,Steam已几乎不可或缺。但正如往昔的读者来信所示,2005年人们对这一全新DRM平台的反应却截然不同。无论是与朋友聊天、在论坛讨论还是下载模组——Steam如今提供的功能早已远不止是一个数字游戏商店。这也正是Valve的这一平台已成为业界不可或缺的一部分的原因。据最新估计,Steam占据了高达75%的数字游戏市场份额。不过,情况并非一直如此。因为当 Steam 于 2003 年底面世时,社区对这项新服务起初持强烈怀疑态度。特别是在初期,Steam 服务器运行相当不稳定,下载速度慢如蜗牛,而且那种军用橄榄绿色的用户界面也显得毫不亲切。但对许多玩家来说,最令人难以忍受的是那种被剥夺所有权的感觉。因为当《半条命2》于2004年发布时,这款射击游戏要求必须拥有Steam账号才能游玩; 否则游戏根本无法启动。Steam是该行业在DRM(数字版权管理)领域迈出的第一步。与账户绑定的游戏突然无法再转售了。鉴于这些情况,Steam最初在PC玩家社区中备受憎恶也就不足为奇了。用户对这项新服务有多不满,可从2005年《PC Gamer》杂志上的一系列读者来信中得到印证,这些来信最近出现在网上。<div class="box do-display-embed m-b-05" data-embed-type=“reddit” data-embed-content='&10;& 10;允许 Reddit 内容'><div class="box do-display-embed m-b-05"...

《马拉松》依然活跃:赛季计划出人意料地展望了遥远的未来,并致力于吸引纯PvE玩家

尽管存在玩家数量下滑的担忧,但《马拉松》仍在积极开发中。这不仅限于PvP领域。《马拉松》在发售时收获了玩家和媒体的诸多赞誉,但一个重大担忧依然存在:索尼的大笔投资能否获得回报?还是说,由于玩家数量根本无法支撑运营成本,Bungie的这款最新射击游戏很快就会落入快速扩大的“在线游戏坟场”?Bungie 目前正释放出充满信心的信号:在一篇详尽的博文中,首席开发者乔·齐格勒(Joe Ziegler)详细阐述了第二季将带来哪些内容、团队的后续规划,以及对《马拉松》整体未来的展望。《近未来》:第二季(夜幕降临)《马拉松》第二季将于6月2日以重置形式开启。届时,等级、装备等进度将被重置(真实货币、皮肤和阵营将保留)。地图变体:以“夜幕降临”为主题,Dire Marsh的夜间版本将登场。这是《马拉松》发布以来首个拥有新时间版本的地图。新机甲:随着“哨兵”(见截图)的登场,一款新的跑者机甲将亮相。这是游戏上线以来首个可玩的新职业。哨兵侧重于防御,目前尚无更多细节。 PvE 实验: 第二赛季将推出两种侧重PvE的实验性新游戏模式,以增加游戏多样性。其中一种包含“轻度PvP”,另一种则是纯粹的合作模式。此外,Bungie 还计划在第二赛季推出: 《夜幕降临》将推出新武器、装备以及“摇篮”系统。该系统旨在未来进一步个性化跑者属性(超越阵营升级的范畴)。Bungie 计划于 5 月 25 日当周公布更多相关信息。长期规划:第 3 至 5 赛季齐格勒证实,团队正在开发另一张地图。此次开发将更侧重于“触及精神本质的外星元素与异常现象”。此外,新敌人也已确认。这些敌人既包括来自“陶星”的新敌人,也包括来自该恒星系以外的敌人。一些长期未解决的问题,如匹配系统、用户界面以及面向新玩家的教程,都将得到解决。各阵营的任务系统也将进行调整。在第3、4和5赛季中,开发者计划进一步优化现有系统和地图,引入更多可玩职业,并通过新增机制扩展“撤离循环”——例如设置带有特殊条件的替代撤离点。此外,新的终局进度系统也在讨论之中。更多面向不玩PvP玩家的内容:如果第2赛季的PvE实验取得成功,开发者计划扩展这一领域,并在多个赛季中逐步完善。他们正在考虑提供比“撤离模式”更快速、更有趣且更少挫败感的替代玩法。齐格勒暗示将推出合作突袭、纯PvP竞技场及其他变体模式,这些内容旨在“适应不同的好友群体、游戏氛围和可利用的游戏时间”。因此,尽管社区内外都曾担心《马拉松》会成为一款服务型失败作,但对Bungie而言,这其实是一个长期项目。齐格勒表示,开发团队的目光已投向2026年之后乃至2027年及以后的未来。这款射击游戏不仅规模将不断扩大,还将提供更深的游戏深度和更丰富的游戏体验。据悉,第二赛季仅仅是为此奠定的第一块基石。随着《夜幕降临》的上线,你们会重返《马拉松》吗?PvE模式是否会成为你们回归的理由?欢迎在评论区留言告诉我们!

这款极具真实感的军事射击游戏将于5周后正式上线,游戏支持100名玩家同时在线,并包含坦克、直升机和舰船

《地狱解锁:越南》在最新预告片中终于公布了发售日期。这款硬核射击游戏将于6月18日(周四)通过PC(Steam和Epic平台)、PlayStation 5以及Xbox Series主机平台推出数字版。主机版的实体盒装版将于8月4日随后发售。Steam版售价40欧元,发售前预购可享10%折扣。豪华版售价60欧元。不过,喜欢写实军事动作游戏的玩家们,现在就可以免费体验《地狱放手:越南》了。2026年5月29日至6月1日将举行公开测试。在这个周末,所有玩家无需激活码或预注册即可加入游戏。《地狱解锁:越南》是2019年射击游戏《地狱解锁》的续作,将二战战场换成了越南茂密的丛林。最多100名玩家将以特定兵种身份争夺霸权,除坦克和直升机外,本次还将引入水上载具。