18.4 C
Berlin
日曜日, 9月 14, 2025

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

Football Manager 26 は、サッカーマネージャーにとって本当に重要なものは、グラフィックではなく順位表であることを示しています。

Football Manager 26 は、Unity エンジンへの移行により、グラフィックの大幅なアップデートが行われます。しかし、真のファンにとっては、これは単なる付記に過ぎません。開発元の Sports Interactive は、本当に重要なことを示しています。 ユーザーインターフェースです。 サッカーマネージャーシリーズの新作では、ユーザーインターフェースが単なる外観上の変更以上のものになりました。新しい「タイルとカード」システムにより、重要な情報を一目で確認できると同時に、クリックひとつで詳細情報を確認することができます。従来のスタート画面に代わり、すべてのニュース、タスク、カレンダーデータをまとめたポータルが導入されました。 ナビゲーションはよりスリムになり、検索機能はよりインテリジェントになります。初心者には、複雑なシミュレーションのすべての詳細を説明する、FMPedia という新しいゲーム内用語集が役立ちます。また、ブックマークを使ってインターフェースをカスタマイズし、ゲーム内の重要なエリアにいつでも直接アクセスできるようにすることもできます。 Football Manager 26 は、2025年11月4日に発売予定です。

「小さな一歩後退」 – Black Ops 7 は動きを変えます

スピードダウン、コントロールアップ – 新しいゲーム感覚 11月に「Call of Duty: Black Ops 7」が発売されると、ストーリーだけでなく、多くのファンがすぐに気付く変化、つまり動きにも注目が集まるでしょう。ここ数年、スプリント、スライド、クライミングのスピードがどんどん速くなっていましたが、 Treyarch は意図的にそのスピードを落とすことにしました。これまでプレイヤーに極端なスピードアップをもたらしていた、いわゆる「タクティカルスプリント」は、標準版では完全に削除されています。 しかし、それはコミュニティがアクセルを踏むことを諦めることを意味するわけではありません。デザインディレクターの Matt Scronce は公式ビデオで次のように説明しています。  「Black Ops 7 のコアとなる動きの基本的なデザイン哲学は、少し一歩後退することでした」 同時に、基本速度はわずかに向上したと明かしています。それでもタクティックスプリントを使用したい場合は、パークシステムで有効化することができます。これは、戦術的なアプローチと攻撃的なプッシュを区別する、賢い工夫です。 これは、ファンコミュニティ内でしばしば熱く議論されている「Call of Duty は戦略的なシューティングゲームであり続けるべきなのか、それともアドレナリン中毒者向けの高速のジェットコースターのようなゲームであるべきなのか」という議論に対する...

レトロフューチャーRPG『エーテル・アンド・アイアン』新ゲームプレイを公開

GlobalESportNewsが独占公開する『エーテル・アンド・アイアン』新トレーラーでは、開発中のRPGの様々な側面を紹介しています。Seismic Squirrelが開発する本作は現在2026年のリリースを目指していますが、具体的な発売日はまだ発表されていません。2025年3月に初公開された『エーテル・アンド・アイアン』は、反重力技術が生活のあらゆる側面を変革した架空の1930年代ニューヨークを舞台とする、レトロフューチャーな物語主導型タクティカルRPG。その技術は「エーテル」と呼ばれる神秘的な物質によって支えられている。本作ではプレイヤーは、ニューヨークで大成功を掴もうとする、疲れ切った密輸業者ジア・ランダッツォを演じる。 『エーテル・アンド・アイアン』が乗り物のカスタマイズや戦術戦闘などを披露 スチームパンクRPGの初発表から半年後、ワシントン州イサクアに拠点を置く開発会社Seismic Squirrelが新たな『エーテル・アンド・アイアン』トレーラーを公開。GlobalESportNewsが独占でその内容をお伝えする。75秒の映像では、説得・欺瞞・暴力に頼りつつ様々な任務を遂行する密輸業者としてのゲームプレイが提示されている。戦術的戦闘や乗り物のカスタマイズなど、『エーテル・アンド・アイアン』の多様なゲームプレイ要素も紹介されている。 20秒付近に登場するスチームパンク風のガレージでは、主人公が自身の車両をチューニングします。トレーラーでは計6つのコンポーネントスロットが確認でき、エンジン、推進装置(レパルサー)、最大4種類の武器の選択を管理します。選択したパーツは車両の重量、アクションポイント、収納容量、そして「ヒート」(車両の目立ち度を測る指標と思われる)を決定します。 『Aether and Iron』では、プレイヤーが仲間を募集・強化し、装備構成を調整することも可能。誰が何を密輸し、どのような装備を携行するかが決定される。これらの選択は全て、環境ハザードといったTRPGジャンルの定番要素を取り入れたターン制車両戦闘で影響を及ぼす。 『Aether and Iron』のストーリーは『Mass Effect』『Far Cry』のライター陣が執筆 トレーラーでは『エーテル・アンド・アイアン』のミッションも一部公開されており、単に敵を全滅させるだけでなく多様な目標が設定されているようだ。ターン制限のあるミッションもあれば、一定間隔で敵が波状攻撃を仕掛けてくる中での目標達成を求められるミッションもある。Unityエンジンで開発される本作のストーリーは、『マスエフェクト』や『ファークライ』、2024年ヴィクトリア朝スチームパンクRPG『ソブリン・シンジケート』を手掛けた作家陣が執筆を担当する。公式概要によれば、プレイヤーは架空の1930年代ニューヨークの暗黒街を探索し、その運命を左右する選択を行うことになる。この設定から、『エーテル・アンド・アイアン』には一定の再プレイ価値が期待できるだろう。 物語の深み、政治的テーマ、対話主導のゲームプレイ、SF設定といった要素は、『エーテル・アンド・アイアン』が『ディスコ・エリジウム』ファンにも訴求する可能性を示唆している。ZA/UMの2019年ヒット作のように戦闘を完全に排除するわけではないが。レトロフューチャーな本作の詳細は、2026年の発売予定に近づくにつれ、今後数ヶ月で明らかになる見込みだ。