1.1 C
Berlin
火曜日, 12月 23, 2025

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

ブリザード、歴史的な発表:2026年は「会社史上最大の年」となる予定 – この約束の背景には何があるのでしょうか?

ブリザードの社長、ジョアンナ・ファリーズ氏は、2026年はこれまでの同スタジオのすべての年を上回る年になると、かなり大胆な発言をしています。 カリフォルニアから、これほど自信に満ちた発言が聞かれるのは久しぶりだ。2024年からブリザード・エンターテイメントの社長を務め、ボビー・コティックの後継者であるジョアンナ・ファリーズは、 Variety 誌のインタビューで、2026 年を 35 年の社史の中で「最大の年」と宣言しました。 それでは、この発表の真意について、一緒に見ていきましょう。 2026年のブリザードのスケジュール 「最大の年」というタイトルを正当化するために、ブリザードの社長は次の切り札を繰り出しています。当社のニュースをフォローしている方は、そのほとんどをご存知でしょう。 WoW: Midnight: 次の拡張パックが 2026 年春にリリースされることは、すでに知られていました。 Diablo 4: Lord of Hatred: サンクチュアリの戦線でも、驚きはありません。 BlizzCon の復活: 中断を経て、社内展示会が復活することはすでに約束されており、9 月開催もすでに確定しています。 2026 年、ブリザードは 35 周年、ディアブロは 30...

Total War: Medieval 3 は、多くの人が考えているよりも早く完成する可能性があるようです。

Medieval 3 は発表されましたが、まだプリプロダクションの段階です。しかし、開発者によると、それはゲームがまだ存在していないことを意味するわけではないそうです。 喜びの後に、失望が訪れました。Total War の 25 周年記念の大型ショーケースで、ついに Medieval 3 が発表されました。しかし、その直後、このゲームはまだプリプロダクション段階にある という話が出てきました。 多くの人々にとって、これは非常に悪い兆候でした。なぜなら、プリプロダクションとは、実際の開発がまだ始まっていないことを意味しているように聞こえるからです。それは、デザイナーがゲームの開発、つまり制作に入る前に、まずそのビジョンについて考えをまとめる、純粋な計画段階にあるという印象を与えます。 In 新しいフォーラムの投稿で、Creative Assembly はそうではないことを明らかにしました。Medieval 3 は、多くの人が想像しているよりも開発が進んでおり、これまで予想されていたよりもリリースが近づいている。 Medieval 3 はすでにプレイ可能Creative Assembly は、Medieval...

野心的なMOBAは、実際には「次の10,000時間プレイされるゲーム」になることを目指していましたが、わずか半年でサーバーを閉鎖することになりました。

Theorycraft Games は、バトルロワイヤルMOBA「Supervive」を数か月後に閉鎖すると発表しました。 「リーグ・オブ・レジェンド」などの MOBA や「フォートナイト」などのバトルロワイヤルは、長年にわたり市場で人気を保っており、2 つの非常に人気のあるジャンルの代表として、今なお成功を収め続けています。 Theorycraft Games はこの成功の一角を分け合おうと、2025年7月に野心的な無料プレイの MOBA「Supervive」をリリースしました。このゲームは、このジャンルとバトルロワイヤルの要素を組み合わせ、競合他社に打ち勝つことを目指していました。 開発スタジオが認めたように、このゲームは失敗に終わり、Supervive は重い心でサービスを終了することになりました。 プレイヤー数の減少 ベータテスト期間中、 2024年11月のベータテストでは、Steam で Supervive は同時に 48,000 人のプレイヤーを記録するという素晴らしい成果を上げました。フルリリースとなった 2025年7月のフルリリース時には、13,000人を記録しました。現在では、1,000人というプレイヤー数をすでに突破しており、2025年10月末には1,000人のプレイヤー数を突破しておらず、そのため、このサービスは終了することになりました。 Steamを通じて、Theorycraft はサーバーが 2026年2月26日午前2時に停止されることを発表しました。それ以降、この Free2Play タイトルはプレイできなくなります。 最近、アップデート...