12.6 C
Berlin
星期三, 25 3 月, 2026

可能是史上最伟大的电子游戏经典,距今已有近40年历史,如今正助力现代研究:超级马里奥与人工智能相遇

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

虽然不是新的标准,但仍然令人兴奋:马里奥成为人工智能的标杆。

人工智能模型的基准测试通常枯燥乏味:数学、逻辑测试、复杂数据分析。但据TechSpot报道,加州大学圣地亚哥分校的研究人员采用了一种新方法——让他们的AI玩《超级马里奥兄弟》

听起来像是一个有趣的实验?也许吧。但毫无疑问,它表明有时时机比纯粹的计算能力更重要。

实验:将GamingAgent作为人工智能控制器

加州大学圣地亚哥分校郝人工智能实验室的研究人员开发了GamingAgent框架(GitHub),该框架允许人工智能模型通过Python代码控制水管工马里奥。

以NES上的《超级马里奥兄弟》模拟版为基础。向人工智能下达了简单的指令,例如跳过这个敌人,以及用于定位的屏幕截图。

目的是了解模型计划行动并实时调整的能力。

Claude 3.7 占据主导地位——GPT-4o 步履蹒跚

结果可能会让你大吃一惊:Anthropic 的 Claude 3.7 表现最佳。它能够精准跳跃,巧妙躲避对手,整体表现自信。

它的前身Claude 3.5表现也不错,虽然没有那么出色。

相比之下,OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro的表现则大相径庭。这些模型以强大的逻辑思维能力而闻名,但它们的表现却令人失望。

它们经常在基本的游戏机制上失败,经常不受控制地跳入空隙或被对手击中。

时机比逻辑更重要

测试表明,快速反应比复杂的逻辑更重要——至少在玩马里奥时是这样。

虽然有些人工智能模型试图对情况进行思考,但这种做法会导致长时间的延迟。

毕竟,在《超级马里奥兄弟》中,仅仅几毫秒的时间就能决定跳跃成功还是失败。

研究人员怀疑,像GPT-4o这样的思维模型在行动前计算时间过长,因此跳到了虚空。

复古游戏作为人工智能基准?

当然,问题仍然是这样的测试有多大意义。击败电子游戏角色马里奥的人工智能模型并不一定适合现实世界中的复杂任务。然而,实验提供了令人兴奋的见解:决定性的因素不仅是计算能力,还包括快速、直观的决策。

RELATED ARTICLES

2026 年 Steam 春季大促销已经开始!所有信息和 13 款从未如此便宜过的特别游戏推荐

春天已经来临,外面的第一批植物已经发芽,但谁会在乎呢,因为成千上万款游戏正在 Steam 上促销。我们为您提供所有信息。嫩芽正在萌发,黑鸟正在歌唱,慕尼黑的诺克贝格(Nockherberg)上空第一批烈性啤酒正在蹒跚而来:春天来了!当然,随之而来的还有首次大型季节性折扣活动--2026 年 Steam 春季特卖会。我们将为您提供关于活动开始时间和持续时间的所有信息,包括令人兴奋的优惠。让我们开始吧!2026 年 Steam 春季特卖会何时开始?由于时差原因,本次 Steam 特卖会比往年提前开始。起始信号为德国时间 2026 年 3 月 19 日下午 6 点。2026...

SteamOS 3.8:如何为 Steam Deck、Xbox Ally 和其他设备安装更新?

Valve 发布了新的 SteamOS 预览版。我们将向您展示如何下载更新。SteamOS 3.8:如何安装更新。Valve 发布了 3.8 版 SteamOS 预览版。由于该版本仍是部分未完成的预览版,因此不会在所有设备上自动下载更新。这必须首先在设置中激活。工作原理:</p按下 Steam 按钮 转到 “设置 ”项目 转到 “系统 ”项目 “系统更新通道...

Steam 上的新游戏:终于为所有喜爱复杂城市建筑的玩家提供了补给

古罗马的建设策略、快节奏的竞赛和充满情感的结局--我们向您展示本周最激动人心的 Steam 新作!本周 Steam 上的游戏将极为丰富多彩:我们再次搜索了发布列表,为您呈现最激动人心的新版本,每个人都能在其中找到自己喜欢的游戏。拿上一杯热饮,与我们一起探索哪些游戏将在未来几天征服您的硬盘!快速导航 </p<ul本周亮点:《新星罗马》(早期进入) 本周更多激动人心的 Steam 版本 <ul3 月 26 日,星期四 3 月 27 日,星期五 本周焦点:《罗马新星》(早期进入)</h2类型:建筑策略 -...