18 C
Berlin
星期日, 10 5 月, 2026

可能是史上最伟大的电子游戏经典,距今已有近40年历史,如今正助力现代研究:超级马里奥与人工智能相遇

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

虽然不是新的标准,但仍然令人兴奋:马里奥成为人工智能的标杆。

人工智能模型的基准测试通常枯燥乏味:数学、逻辑测试、复杂数据分析。但据TechSpot报道,加州大学圣地亚哥分校的研究人员采用了一种新方法——让他们的AI玩《超级马里奥兄弟》

听起来像是一个有趣的实验?也许吧。但毫无疑问,它表明有时时机比纯粹的计算能力更重要。

实验:将GamingAgent作为人工智能控制器

加州大学圣地亚哥分校郝人工智能实验室的研究人员开发了GamingAgent框架(GitHub),该框架允许人工智能模型通过Python代码控制水管工马里奥。

以NES上的《超级马里奥兄弟》模拟版为基础。向人工智能下达了简单的指令,例如跳过这个敌人,以及用于定位的屏幕截图。

目的是了解模型计划行动并实时调整的能力。

Claude 3.7 占据主导地位——GPT-4o 步履蹒跚

结果可能会让你大吃一惊:Anthropic 的 Claude 3.7 表现最佳。它能够精准跳跃,巧妙躲避对手,整体表现自信。

它的前身Claude 3.5表现也不错,虽然没有那么出色。

相比之下,OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro的表现则大相径庭。这些模型以强大的逻辑思维能力而闻名,但它们的表现却令人失望。

它们经常在基本的游戏机制上失败,经常不受控制地跳入空隙或被对手击中。

时机比逻辑更重要

测试表明,快速反应比复杂的逻辑更重要——至少在玩马里奥时是这样。

虽然有些人工智能模型试图对情况进行思考,但这种做法会导致长时间的延迟。

毕竟,在《超级马里奥兄弟》中,仅仅几毫秒的时间就能决定跳跃成功还是失败。

研究人员怀疑,像GPT-4o这样的思维模型在行动前计算时间过长,因此跳到了虚空。

复古游戏作为人工智能基准?

当然,问题仍然是这样的测试有多大意义。击败电子游戏角色马里奥的人工智能模型并不一定适合现实世界中的复杂任务。然而,实验提供了令人兴奋的见解:决定性的因素不仅是计算能力,还包括快速、直观的决策。

RELATED ARTICLES

《生化危机:安魂曲》:虽然剧情DLC可能还要再等一等,但现在你们可以操控里昂在无尽模式中狂奔了

虽然没有剧情DLC,但这个是免费的: 通过Leon Must Die Forever,在通关《生化危机:安魂曲》的主线剧情后,你们现在可以挑战这个极具挑战性的无尽模式,大展身手了。遵循类Roguelike的游戏机制,你将化身莱昂在20个随机生成的关卡中挥刀射击,并在规定时间内击败最终BOSS。各种强化道具和带有额外效果的搞笑配件将助你一臂之力。不过,一旦你阵亡,乐趣便将从头开始。《Leon Must Die Forever》现已作为免费更新登陆所有可购买《Resi Requiem》的平台。

“对细节的敏锐洞察”——《战争黎明4》新预告片让机械之神的信徒们瞬间跪地膜拜

在《战锤40,000:战争黎明4》的最新预告片中,机械教团首次作为可玩阵营详细亮相。这些机械祭司凭借火力、重型战争机械以及对战场的战术控制力,将斯基塔里、凯塔弗隆突击者、卡斯特兰机器人、奥纳格沙地爬行者,甚至一架骑士卡斯特兰投入到为奥姆尼西亚而战的战场中。“诺斯费尔网络”听起来尤为令人兴奋,它将建筑物、单位和固定武器相互连接,使该派系日益强大。此外还有两位指挥官:专注于侦察和灵活装备的科技考古学家 Potentia-Delta 9,以及在前线直接增援部队的 Skitarii 元帅 Sek-Ix-23。《战争黎明4》预计将于2026年登陆PC平台。具体日期尚未公布。

如果你喜欢《Stray》和《Little Kitty, Big City》,那么《Schrodinger’s Cat Burglar》可能会让你体验到偷窃的乐趣

猫咪爱好者注意了: 如果你喜欢《Stray》或《Little Kitty, Big City》这类动物冒险游戏,那么很快就会有新作品问世。在这款巧妙的解谜冒险游戏《Schrodinger's Cat Burglar》中,你将化身为技艺高超的猫贼 Mittens。在一场离奇的科学实验后,她获得了一项不可思议的能力:米汀斯可以分裂成两个版本——一个是她的“真实”身体,另一个则是猫咪的幽灵般的量子版本。只需轻点按钮,即可在两种版本之间自由切换,在研究实验室中破解复杂的开关谜题,悄无声息地骗过严密的安保机器人,并像猫一样把咖啡杯从办公桌上扔下去。在本地合作模式中,你可以选择与一位朋友一起游玩,让他协助你逃离实验室。《薛定谔的猫盗贼》将于2026年5月21日发布。