-1.8 C
Berlin
木曜日, 2月 5, 2026

おそらく史上最高のビデオゲームの古典は、発売から40年近く経つが、今も最新の研究に役立っている。スーパーマリオがAIと出会う

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

新しい標準ではないが、それでもワクワクする。マリオがAIのベンチマークとして。

AIモデルのベンチマークは、数学や論理テスト、複雑なデータ分析など、退屈なものになりがちです。しかし、カリフォルニア大学サンディエゴ校の研究者は、新しいアプローチを採用しました。TechSpotのレポートによると、彼らはAIにスーパーマリオブラザーズプレイさせたのです。

好奇心をそそる実験のように聞こえますか? そうかもしれません。 しかし、純粋な演算能力よりもタイミングが重要な場合があることは確かです。

実験:AIコントローラーとしてのGamingAgent

カリフォルニア大学サンディエゴ校のHao AI Labの研究者は、Pythonコードを介してAIモデルが配管工マリオを制御することを可能にするGamingAgentフレームワーク(GitHub)を開発しました。

NES版スーパーマリオブラザーズのエミュレート版が基礎として使用された。AIには、この敵を飛び越える といった簡単な指示や、オリエンテーション用のスクリーンショットが与えられた。

目的は、モデルがどれほどうまく行動を計画し、リアルタイムで適応できるかを調べることにあった。

Claude 3.7が圧倒的な強さを見せる – GPT-4oは苦戦

結果はあなたを驚かせるかもしれません: AnthropicのClaude 3.7が最高のパフォーマンスを見せました。正確なジャンプを習得し、相手を巧みにかわし、全体的に自信を持って行動しました。

その前のモデルであるClaude 3.5も、それほど印象的ではないものの、良いパフォーマンスを見せました。

それに対して、OpenAIとGoogleのGemini 1.5 ProからリリースされたGPT-4oは、全く異なる結果となりました。 実際、強力な論理的思考能力で知られるこれらのモデルは、苦戦を強いられました。

彼らはしばしば基本的なゲームの仕組みを理解できず、制御不能にギャップに飛び込んだり、相手にぶつかったりしました。

タイミングが論理に勝る

テストの結果、反射神経の速さが複雑な論理よりも重要であることが分かりました。少なくともマリオをプレイしているときは。

一部のAIモデルは状況を考慮して思考しようとしますが、このアプローチは長い遅延につながります。

結局のところ、スーパーマリオブラザーズではほんの数ミリ秒の違いが、ジャンプの成功と失敗を分けることになります。

研究者たちは、思考モデルであるGPT-4oが、行動を起こすまでに計算にあまりにも長い時間を費やし、その結果、空虚へと飛び込んでしまうのではないかと疑っています。

レトロゲームをAIのベンチマークとして?

もちろん、そのようなテストがどれほど意味があるかという疑問は残ります。ビデオゲームのキャラクター、マリオに勝つAIモデルが、自動的に現実世界の複雑なタスクに適しているわけではありません。しかし、この実験は興味深い洞察を提供しています。決定的なのはコンピューティング能力だけでなく、高速で直感的な意思決定でもあるということです。

RELATED ARTICLES

ディアブロ 4:「Lord of Hatred」の 2 つ目のクラスに関するリークが憶測を呼ぶ

ディアブロ 4 は、4 月に「Lord of Hatred」という次の大型拡張パックのリリースを予定しています。新しいエリアやストーリー要素に加え、特に注目されているのは、 このアドオンでは、どの第2クラスが導入されるのか? ブリザードは、2026年のゲームアワードで、予約購入特典としてパラディンを発表していました。しかし、それ以来、第2クラスに関する公式の詳細は発表されていませんでした。ところが、コミュニティの周辺で、新たな情報が飛び込んできました。 コンセプトグラフィックがサブレディットに登場 Diablo 4 のサブレディットで、おそらくリークされたコンセプトグラフィックが共有されました。これは、2 つ目のクラスがパラディンよりもはるかに暗い方向に向かう可能性があることを示唆していると見られています。 ただし、どのクラスが示されているかは明らかではありません。報道によると、これはコンセプト素材であり、必ずしも最終的な実装を反映しているわけではないとのことです。 理論:ブラッドナイトがディアブロ 4 に登場する可能性 議論では、主に 1 つの名前が挙げられています。それは、ブラッドナイトです。このクラスは、これまでディアブロ イモータルでのみ知られています。現在、ブラッドナイトが新しいクラスとしてメインゲームに採用されるかもしれないという説が広まっています。 ディアブロ イモータルでは、ブラッドナイトは近接戦闘と遠距離戦闘の両方を行う混合クラスです。また、吸血鬼の力と超自然的な強さを備えていると説明されています。 ブリザードは以前、このクラスを排除していた この報道によると、ブリザードは『ディアブロ 4』のリリース前に、ブラッドナイトは『ディアブロ 4』に登場しないことを発表していた。この姿勢が現在変化しているかどうかは不明である。公式の確認は得られていない。 その他のアイデア:ウォーロック、あるいはウィッチドクターの復活 ブラッドナイト以外にも、いくつかの可能性が議論されている。その中には、新しいクラスとして登場する可能性のあるウォーロックも挙げられている。また、ディアブロ 3...

Tarkov が Stalker と出会う:最も期待されているシングルプレイヤーシューティングゲームのひとつが、4 月に Steam で早期アクセスを開始

Road to Vostok はまもなくテスト段階に入り、正確な日付と価格も発表される予定です。 フィンランドのソロ開発者、アンティ・レイノネンは数年前から「Road to Vostok」の開発に取り組んでいます。多くの作業と、無料デモ版をプレイしたプレイヤーからのフィードバックを経て、Steam での早期アクセス開始が間近に迫っています。このゲームは現在、6位 に位置しています。 Road to Vostok の早期アクセスリリース リリース日:早期アクセスは 2026 年 4 月 7 日に開始されます。 価格:Steam の Steam でのスタンダードエディションの価格は 20...

Steamの新作:50万以上の戦略ファンが期待を寄せるドイツの戦術ゲーム

今週のSteamリリース:巧妙な戦略から容赦ないアクションまで、注目すべき新作ゲームをご紹介します。 2月は、戦略家たちにとって大きな衝撃的なスタートとなりました。ドイツの Overhype Studios の開発者たちが、その戦術的な才能を宇宙の広大な暗闇へと移す一方で、Team Ninja はそのルーツに立ち返り、恐怖を教えます。しかし、それだけではありません。今週の Steam の重要なリリースをすべてまとめたコンパクトな概要をご紹介します。 今週のハイライト:MENACE (ジャンル: ターン制ストラテジー - 開発者: Overhype Studios - リリース: 2026年2月5日 (Steam)   待望の「続編」が登場: Battle Brothers で傭兵部隊を生き延ばすために無数の時間を費やしてきたプレイヤーは、今、安堵の息をつくことができるでしょう。むしろ、息をひそめるべきかもしれません。 Overhype Studios は、暗黒の中世を離れ、Menace...