17.2 C
Berlin
星期二, 23 9 月, 2025

50,000 小时后:人工智能本应解决人类问题,却因《神奇宝贝红色》而失败

Follow US

80FansLike
908FollowersFollow
57FollowersFollow

在流行文化中,很少有东西能像口袋怪兽的游戏机一样让人怀念。但如果把人工智能植入神奇宝贝,会发生什么呢?

此外,该技术(有望)应用于生活中的许多领域,从汽车自动驾驶、工厂机器人到智能手机和家用电脑。

但人工智能是否也能出色地玩经典 GameBoy 游戏《口袋妖怪红色》?

A (YouTuber)with a knack for programming and a soft spot for the little monsters took on this question – with astonishing results.

这位YouTuber的神奇宝贝实验是如何进行的?

实验背后的人工智能在软件开发者和YouTuber Peter Whedon的带领下,总共玩了超过(50,000小时)神奇宝贝红色。
对于(彼得-韦登)挑战之一是如何训练人工智能,使其表现得像人类玩家一样。据这位 YouTuber 称,人工智能的行为与人类球员非常相似


每次行动之后,人工智能都要查看屏幕上发生了什么,然后再决定下一步行动–就像一个人拿着口袋游戏机在眼前玩《口袋妖怪红色》一样。为了尽快训练人工智能,韦登同时进行了 40 次测试。

(Joaquin Corbalan/Adobe Stock; Peter Whidden))” src=”https://www.global-esports.news/wp-content/uploads/2023/11/For-his-experiment.jpg” width=”1920″ height=”1080″ /☻

奖励系统技巧:如何教人工智能玩《口袋妖怪红色》游戏?YouTuber 选择的解决方案是:他创建了一个奖励系统,让算法以赢得游戏为目标。每当人工智能在游戏中发现新的东西,它就会得到一个奖励点

这里所说的 “新 “是以屏幕上不同像素的数量来衡量的。不过,这种方法也有缺点,即人工智能控制的角色是在观看水动画,而不是在成功完成游戏的意义上继续玩游戏。

此外,还创建了额外的奖励点,例如捕获神奇宝贝、在竞技场获胜或在训练师战斗中获胜。

Hidden把他的实验编成了33分钟的YouTube视频。

人工智能在访问神奇宝贝中心时储存了一些神奇宝贝。这导致了团队整体水平的下降。由于这次糟糕的经历,人工智能从此避开了神奇宝贝中心。由此带来的弊端是:从这时起,团队不再治疗


Hidden 在他的 YouTube 视频中讲述了实验过程:

“它(人工智能)不像人类那样有情感,但奖励价值极高的事件会对它的行为产生持久影响[……]在这种情况下,它只需要失去一次神奇宝贝。这让人工智能对整个神奇宝贝中心产生了负面联想,导致它在以后的游戏中完全避开该中心。”

所以韦登不得不进一步调整他的奖励系统。

顺便说一句:神奇宝贝最近已经跃上了大银幕,下面的电影预告片就证明了这一点。

神风特攻队模式下的人工智能:人工智能最初的战斗表现同样引人注目。一开始,它不顾胜算,匆忙投入每一场战斗。这就是为什么 Youtuber 引入了输掉战斗的惩罚措施。
威登面临的最大挑战是逐步学习游戏中理想行为的算法。在这种情况下,由于不像文本或语音人工智能那样有大量的数据集,他必须分小块学习实现游戏目标的行为算法。

(TechCrunch)韦登对他的 YouTube 视频取得巨大成功感到高兴,到目前为止(2023 年 11 月 10 日),该视频的观看人数已超过 430 万。他说:

“看到这么多人参与(视频),我感到非常高兴。”

What”?

人工智能做得好的地方

但人工智能并不只是制造问题,有时它甚至非常聪明。然后,在某些时候,它一遍又一遍地使用相同的路线。起初看似毫无意义的事情,后来却变得非常聪明。人工智能利用了一个错误。这意味着,它遇到的第一只神奇宝贝一扔就被抓住了。

你能改进 YouTuber 的神奇宝贝实验吗?Additionally, Whedon offers a few tips in his video on how to try conducting such an experiment yourself.

例如,他使用了所谓的近端策略优化(PPO)。在(OpenAI)据说这种学习算法可以提供 “与当前方法相当或更好的性能”。据说 PPO 还易于实现和调整。

你怎么看这位 YouTuber 的实验?还有:你觉得附带的视频有趣吗?你是否一看到《口袋妖怪红色》就会怀旧,或者一提到《皮卡丘》就会对《数码宝贝》发誓并怀疑自己的鼻子。请在下面的评论中告诉我们你的想法

RELATED ARTICLES

FC 26 中更多付费制胜:今年,不花真金白银就很难进入终极球队了

观点:EA Sports FC 26 让终极球队对那些不想一直付费的人来说变得不公平了。 每年 9 月,同样的仪式都会开始:人们满怀期待地投入新赛季的终极团队,制定计划,梦想组建完美的团队。每年,我都感觉出版商 Electronic Arts 为我们设置了越来越多的障碍。但在《FC 26》中,这已经不是一种隐约的感觉了。这里清楚地表明: 不付费的人从一开始就处于明显劣势。  贪婪有了新名字:首发高级通行证 还记得 2024 年吗?当时关于《FC 25》将推出收费高级通行证的传闻引起了轩然大波。粉丝们的抗议声如此之大,以至于 EA 显然打消了这个念头,该通行证最终没有推出。 几个月后,在 2025 年...

我知道游戏领域存在一些问题,但《无主之地4》的情况更是雪上加霜。

我很遗憾有理由写这篇文章。而且这已经不是第一次了。 今年年初,我们测试了 Geforce RTX 5090,在 4K 分辨率下,它平均在九款游戏中达到了 100 FPS 以上。这是在没有通过 DLSS 等技术进行升级,也没有使用帧生成的情况下,在最高预设下测得的。 当我们使用这些设置和 Geforce RTX 5090 玩《无主之地 4》时,帧率约为 40 至 50...

《战地风云6》的开发者们认为,你们“玫瑰色的眼镜”几乎使重新制作备受喜爱的旧地图成为不可能——你们怎么看?

像阿曼湾或大集市这样的旧地图能否回归,而不辜负粉丝们的高期望呢? 每当新《战地》游戏问世,粉丝社区就会再次掀起一场老生常谈的讨论: 前作中的旧地图会以翻新的形式回归吗? 仅出于怀旧之情,许多《战地》老玩家就希望能在《战地 6》中再次体验到《阿曼湾》、《卡坎德之战》或《威克岛》等传奇地图。 问题在于: 据《战地》开发商 DICE 称,许多粉丝对旧地图抱有 玫瑰色眼镜 的看法。 这使得重制工作变得非常困难。 现在,我们想向我们的社区提出两个问题: 根据自己的经验,你们能证实这种粉红色的眼镜的存在吗? 你们希望《战地6》重制哪些旧地图? 玩家期望与技术障碍 DICE 设计总监 Shashank Uchil 发表评论 在接受PCGamesN 网站采访时,就地图重制问题发表了以下看法: 你不会相信这有多难。因为(玩家)的期望。人们熟悉地图,对它有特定的期望。但人们也会带着玫瑰色的眼镜来看待它,就像: 以前就是这样的。 但除了怀旧之情之外,据乌奇尔称,还有其他因素使旧版《战地》地图的重制变得非常困难——最主要的是《战地6》的新破坏技术: 如何使与该套装中的其他地图一样具有可破坏性?如何确保这些地图与新武器兼容,这些武器与中的武器不同?这比想象中要复杂得多。 你们希望重制哪些地图? 现在是时候发表你的看法了。 欢迎在评论区留言,说明你是否从自己的经验中证实了粉红眼镜现象。 接下来的调查将探讨你们希望《战地6》重制哪些旧地图。欢迎投票,我们拭目以待! 最后,让我们回到粉红眼镜的话题:DICE 的制作人杰里米·查布(Jeremy Chubb)将应对粉丝的期望称为“走钢丝”,因为粉丝们对地图的重制版本有着非常明确的期望。但与此同时,如果 DICE 无法将《战地 6》的新功能和创意融入新版本地图中,用户也会感到失望。