16.2 C
Berlin
星期六, 9 8 月, 2025

可能是史上最伟大的电子游戏经典,距今已有近40年历史,如今正助力现代研究:超级马里奥与人工智能相遇

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

虽然不是新的标准,但仍然令人兴奋:马里奥成为人工智能的标杆。

人工智能模型的基准测试通常枯燥乏味:数学、逻辑测试、复杂数据分析。但据TechSpot报道,加州大学圣地亚哥分校的研究人员采用了一种新方法——让他们的AI玩《超级马里奥兄弟》

听起来像是一个有趣的实验?也许吧。但毫无疑问,它表明有时时机比纯粹的计算能力更重要。

实验:将GamingAgent作为人工智能控制器

加州大学圣地亚哥分校郝人工智能实验室的研究人员开发了GamingAgent框架(GitHub),该框架允许人工智能模型通过Python代码控制水管工马里奥。

以NES上的《超级马里奥兄弟》模拟版为基础。向人工智能下达了简单的指令,例如跳过这个敌人,以及用于定位的屏幕截图。

目的是了解模型计划行动并实时调整的能力。

Claude 3.7 占据主导地位——GPT-4o 步履蹒跚

结果可能会让你大吃一惊:Anthropic 的 Claude 3.7 表现最佳。它能够精准跳跃,巧妙躲避对手,整体表现自信。

它的前身Claude 3.5表现也不错,虽然没有那么出色。

相比之下,OpenAI的GPT-4o和谷歌的Gemini 1.5 Pro的表现则大相径庭。这些模型以强大的逻辑思维能力而闻名,但它们的表现却令人失望。

它们经常在基本的游戏机制上失败,经常不受控制地跳入空隙或被对手击中。

时机比逻辑更重要

测试表明,快速反应比复杂的逻辑更重要——至少在玩马里奥时是这样。

虽然有些人工智能模型试图对情况进行思考,但这种做法会导致长时间的延迟。

毕竟,在《超级马里奥兄弟》中,仅仅几毫秒的时间就能决定跳跃成功还是失败。

研究人员怀疑,像GPT-4o这样的思维模型在行动前计算时间过长,因此跳到了虚空。

复古游戏作为人工智能基准?

当然,问题仍然是这样的测试有多大意义。击败电子游戏角色马里奥的人工智能模型并不一定适合现实世界中的复杂任务。然而,实验提供了令人兴奋的见解:决定性的因素不仅是计算能力,还包括快速、直观的决策。

RELATED ARTICLES

《战地6》支持跨平台联机吗?DICE 提出了一种可能让所有人都满意的解决方案

DICE 是否找到了让所有人都满意的跨平台联机解决方案?看起来他们已经非常接近了,《战地6》就是最好的证明。 在《战地2042》中,跨平台游戏功能默认开启,这导致比赛难以保持平衡,社区反响也不佳。关闭该功能的选项被埋在设置的某个角落。而《战地6》则采取了不同的做法,试图保留PC和主机共同匹配的优势。 优先跨平台游戏  《战地》制作人 Alexia Christoffi 在一篇 X 文章中解释了新系列游戏中的跨平台游戏选项。基本上,您可以轻松启用或禁用跨平台游戏。但是,如果启用了跨平台匹配,就会出现一个特殊情况。 《战地6》将提供完全跨平台、仅限游戏机跨平台或特定游戏机平台(例如PS5与PS5进行匹配)跨平台等选项。W after W after W after W#Battlefield6— Zachary Davidson (@Ryangofett_2490) August 2, 2025 如果您启用了跨平台游戏,系统会首先尝试找到一个包含主机玩家的游乐厅,或者创建一个只包含此类玩家的游乐厅。 然而,如果这需要太长时间或影响您的连接质量,匹配系统将也从其他平台的玩家中进行匹配。  在《战地风云...

“你们还好吗?”——《博德之门3》迎来两周年纪念日,公布令人惊喜的全新内容,连忠实粉丝都为之震惊

Larian又公布了一系列有趣的统计数据。例如,有多少玩家通关了荣誉模式。或者有多少玩家将Minsc改造成了死亡牧师。没错,说真的。 《博德之门 3》已经两岁了,因为这个数字还不够说一句,拉里安为了庆祝又公布了一堆令人兴奋的统计数据。是的,我们以前在数学课上也没想到我们会对百分比和数字感兴趣,但在这种情况下——总是如此。 有些信息有点让人不安,但这非常符合这款从不把自己太当回事的RPG游戏。 几乎没有吟游诗人,但角色组合非常狂野 只有不到 2% 的玩家通过演奏音乐赚到了 100 金币。这并不一定说明他们喜欢吟游诗人职业!但显然有些粉丝喜欢葡萄酒,因为 2.07% 的玩家在醉酒状态下击败了至少 20 名对手。近 50 万玩家尝试了残酷的荣誉模式。Larian对此评论道:“我们希望你们喜欢痛苦。” 毕竟有4647人成功地用1级角色完成了最高难度的游戏——真了不起! 说到“了不起”,这听起来几乎像“Respec”(重新分配属性点),嗯,这就是过渡语了。在所有同伴中,影之心、威尔和盖尔被改造的频率最高。这并不奇怪,尤其是善良的夏尔追随者,她的初始属性几乎无法击中任何目标。此外,她还经常从“诡计领域”被改为“生命领域”或“死亡领域”。有趣的是,这两个子类都与她的故事非常契合。 近 50 万玩家尝试了残酷的荣誉模式。Larian 对此评论道:“希望你们喜欢痛苦。”毕竟有 4447 人成功以 1...

我们评选出的有史以来最佳故事游戏榜单第一名现已登陆智能手机平台,这一版本让原本团结的玩家社区产生了分歧。

《Disco Elysium》被许多玩家视为绝对的角色扮演游戏杰作。然而,这款备受喜爱的故事游戏的移动端移植版却引发了争议。 Disco Elysium 最近推出了移动版本——对于如此大型的角色扮演游戏来说,这是一个雄心勃勃的移植版本。许多人担心的事情终于发生了:智能手机版本并没有受到大多数粉丝的欢迎。 尽管如此,Disco Elysium 仍然被许多人视为有史以来最好的故事游戏之一——包括我们在内。在当时的故事情节排名中,我们理所当然地将这款角色扮演游戏选为第一名。 移动版《迪斯科伊利西姆》的内容 《迪斯科伊利西姆》移动版于 8 月 5 日在 Android 平台上发布,内容比原版大幅精简。这款角色扮演游戏并非原封不动地移植到移动平台,而是根据目标群体和技术限制进行了调整。 这意味着,故事和角色扮演元素更加线性,我们像在点击式冒险游戏中一样控制侦探,而不是像原版游戏中那样从等距视角进行操作。基本上,绘画风格和故事与原版保持一致。 即使经过修改,Disco Elysium仍然是一款非常高品质的手机游戏。您可以在我们对原版游戏的评测中了解详情。 在困惑、愤怒和希望之间 尽管如此,移植版本还是给社区带来了许多挫折,在Reddit上发泄不满。其中一个原因是令人困惑的货币化模式。尽管在描述中有所提及,但许多玩家仍然无法接受在游戏过程中被要求付费。游戏开始时可以免费玩,但当故事进展到一定程度时,玩家需要支付 10 欧元才能继续游戏。 另一方面,许多玩家对品牌处理方式感到不满。他们指责工作室只考虑利润,利用已离开的原始开发者的愿景来赚取更多钱——这与游戏本身所批评的内容形成鲜明对比。 一些人呼吁抵制甚至非法下载,而另一些人则对移动版本引起如此大的争议感到困惑。 用户 Snoo-15714 写道: 我完全不明白为什么有人会去关注自己明知会讨厌的东西。我不理解这种“仇视观看”或“仇视玩”的行为。如果不想让某件事存在,就别理它。与某件事互动,就等于赋予它力量。 许多玩家都认为,作为原版游戏的爱好者,没有理由去尝试移动版。毕竟,移动版提供的游戏体验更差。其他人则表现得更加乐观。对他们来说,安卓版本是面向那些之前从未接触过《迪斯科·伊利西姆》的新玩家。nbsp;因此,移植版本为他们提供了了解这款精彩游戏的机会。 在 Google Play上,移动版本目前的评分为 2.7 星(949...