19.9 C
Berlin
金曜日, 8月 1, 2025

おそらく史上最高のビデオゲームの古典は、発売から40年近く経つが、今も最新の研究に役立っている。スーパーマリオがAIと出会う

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

新しい標準ではないが、それでもワクワクする。マリオがAIのベンチマークとして。

AIモデルのベンチマークは、数学や論理テスト、複雑なデータ分析など、退屈なものになりがちです。しかし、カリフォルニア大学サンディエゴ校の研究者は、新しいアプローチを採用しました。TechSpotのレポートによると、彼らはAIにスーパーマリオブラザーズプレイさせたのです。

好奇心をそそる実験のように聞こえますか? そうかもしれません。 しかし、純粋な演算能力よりもタイミングが重要な場合があることは確かです。

実験:AIコントローラーとしてのGamingAgent

カリフォルニア大学サンディエゴ校のHao AI Labの研究者は、Pythonコードを介してAIモデルが配管工マリオを制御することを可能にするGamingAgentフレームワーク(GitHub)を開発しました。

NES版スーパーマリオブラザーズのエミュレート版が基礎として使用された。AIには、この敵を飛び越える といった簡単な指示や、オリエンテーション用のスクリーンショットが与えられた。

目的は、モデルがどれほどうまく行動を計画し、リアルタイムで適応できるかを調べることにあった。

Claude 3.7が圧倒的な強さを見せる – GPT-4oは苦戦

結果はあなたを驚かせるかもしれません: AnthropicのClaude 3.7が最高のパフォーマンスを見せました。正確なジャンプを習得し、相手を巧みにかわし、全体的に自信を持って行動しました。

その前のモデルであるClaude 3.5も、それほど印象的ではないものの、良いパフォーマンスを見せました。

それに対して、OpenAIとGoogleのGemini 1.5 ProからリリースされたGPT-4oは、全く異なる結果となりました。 実際、強力な論理的思考能力で知られるこれらのモデルは、苦戦を強いられました。

彼らはしばしば基本的なゲームの仕組みを理解できず、制御不能にギャップに飛び込んだり、相手にぶつかったりしました。

タイミングが論理に勝る

テストの結果、反射神経の速さが複雑な論理よりも重要であることが分かりました。少なくともマリオをプレイしているときは。

一部のAIモデルは状況を考慮して思考しようとしますが、このアプローチは長い遅延につながります。

結局のところ、スーパーマリオブラザーズではほんの数ミリ秒の違いが、ジャンプの成功と失敗を分けることになります。

研究者たちは、思考モデルであるGPT-4oが、行動を起こすまでに計算にあまりにも長い時間を費やし、その結果、空虚へと飛び込んでしまうのではないかと疑っています。

レトロゲームをAIのベンチマークとして?

もちろん、そのようなテストがどれほど意味があるかという疑問は残ります。ビデオゲームのキャラクター、マリオに勝つAIモデルが、自動的に現実世界の複雑なタスクに適しているわけではありません。しかし、この実験は興味深い洞察を提供しています。決定的なのはコンピューティング能力だけでなく、高速で直感的な意思決定でもあるということです。

RELATED ARTICLES

Grounded 2: 生存ゲームがほぼ5万人の同時接続プレイヤーを記録し、今後のアップデート計画を直ちに発表

Grounded 2が記録的なスタートを切る:生存ゲームが数万人のプレイヤーを魅了し、充実した今後のアップデート計画を明らかにしました。 Grounded 2のリリースにより、開発元のObsidian Entertainmentは、多くの人の期待を上回る驚異的な成功を収めました。 プレイヤーが昆虫のサイズに縮んで庭で生き残る人気サバイバルアドベンチャーの続編は、Steamのプレイヤー数で前作を大幅に上回っています。そして、Grounded 2は未だ早期アクセス段階です! Obsidian もそのことを認識しており、今後 12 ヶ月間の広範な Grounded 2 ロードマップを発表しました。 0 から 50,000 へ 2025年7月29日のリリース時には、Steamで49,836人が同時にGrounded 2をプレイしました。一方、最初のGroundedの最高同時接続者数は32,012人で、これは55%の増加となります。 Steamの数字に加え、MicrosoftのGame Pass経由でタイトルを利用しているプレイヤーも含まれます。サブスクリプションユーザーはゲームに追加料金を支払う必要はありません。 前作の『Grounded』は2024年2月までに2000万人以上のプレイヤーを達成しました(正確な販売数は不明)。『Grounded 2』は、この好調なスタートを受けて、さらに大きな成功を収めることが予想されます。早期アクセステストでも、私たちはこのゲームに魅了されました: Steam のレビューでは、まだ改善の余地があります。現在までに投稿された約2,000件のレビューのうち、編集時点では75%がポジティブな評価でした。Grounded 2は「主にポジティブ」と評価されていますが、パフォーマンス、グラフィック設定の少なさ、ラグに関する批判もあります。また、セーブデータの破損に関する報告も一部あります。 開発者の...

バトルフィールド6:価格漏洩がファンを驚かせたが、EAは即座に否定:「価格上昇はありません」

バトルフィールド 6の価格は80ユーロにはならない。関連するリークをきっかけに、プレミアム、DLC、バトルパスに関する議論が沸き起こった。 7月30日の更新: EAは、投資家向けカンファレンスで、フルプライスゲームにおける価格を$80または€80に調整する計画はないと表明しました。 したがって、漏洩したバトルフィールド6の最大80ユーロの価格情報は正しくないと推測されます。 EAのCEOアンドリュー・ウィルソンは、カンファレンスで競合他社(任天堂など)がバトルフィールド6(BF6)の価格をデフォルトで80ユーロに引き上げる件に関する質問に次のように回答しました: 現時点では価格変更の計画はありません – 少なくとも現時点では。 当社は今後も顧客に高い価値を提供するため、異なる価格モデルを継続的に検討していきますが、現時点では劇的な変更の計画はありません。 Xbox は最近、ファンからの批判を受けて『The Outer Worlds 2』の価格改定を撤回しました。Gearbox のランディ・ピッチフォードも『Borderlands 4』の価格を 80 ユーロに設定する可能性を提示しましたが、最終的に 70 ユーロのままとなりました。Switch 2 の新作ゲーム『Mario Kart World』などは既に...

バトルフィールド6:価格漏洩がファンを驚かせたが、EAは即座に否定:「価格上昇はありません」

バトルフィールド 6の価格は80ユーロにはならない。関連するリークをきっかけに、プレミアム、DLC、バトルパスに関する議論が沸き起こった。 7月30日の更新: EAは、投資家向けカンファレンスで、フルプライスゲームにおける価格を$80または€80に調整する計画はないと発表しました。 したがって、漏洩したバトルフィールド6の最大80ユーロの価格情報は正しくないと推測されます。 EAのCEOアンドリュー・ウィルソンは、カンファレンスで競合他社(任天堂など)がバトルフィールド6(BF6)の価格をデフォルトで80ユーロに引き上げる件に関する質問に次のように回答しました: 現時点では価格変更の計画はありません – 少なくとも現時点では。 当社は今後も顧客に高い価値を提供するため、異なる価格モデルを徹底的に検討していきますが、現時点では劇的な変更の計画はありません。 Xbox は最近、ファンからの批判を受けて『The Outer Worlds 2』の価格改定を撤回しました。Gearbox のランディ・ピッチフォードも『Borderlands 4』の価格を 80 ユーロに設定する可能性を提示しましたが、最終的に 70 ユーロのままとなりました。Switch 2 の新作ゲーム『Mario Kart World』などは既に...