-3.7 C
Berlin
木曜日, 1月 22, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

タイタンフォールの開発者による新作シューティングゲームが1週間以内に発売されるにもかかわらず、依然として沈黙が続いている。

来週、シューティングゲーム「Highguard」が発売される予定である。しかし、マーケティング攻勢が行われる代わりに、開発者のチャンネルでは不気味な沈黙が続いている。 これは奇妙な状況である : 以前、絶賛された「Titanfall」シリーズを手がけたベテランたちが開発した新作タイトルが、まもなく発売される。 通常、発売の6日前というこの段階では、予告編やブログ投稿、コミュニティとの交流が大幅に増加することが予想される。しかし、「Highguard」の場合はその逆だ。 2025年12月の「The Game Awards」で、サプライズとして「One More Thing」の締めくくりとして発表されたこのゲームは、ほぼ完全に表舞台から姿を消しており、謎に包まれています。 大々的な登場以来、沈黙が続く 「Highguard」の X アカウントへの最後の公式投稿は、2025年12月12日付です。その皮肉は明らかです。この最後の投稿で、ソーシャルメディアチームは、有名な音楽プロデューサーである Zedd の関心に「もっとお見せできるのが待ちきれません」と返答しました。しかし、それ以来、何も公開されていません。DJ Zedd も、一般の人々も、何も見せていない。 しかし、少なくとも紙面上では、このプロジェクトには多くの魅力がある。 Titanfall の元開発者たちによる新しいシューティングゲーム、それは、迫力あるガンプレイと滑らかな動きをすぐに想像させる。にもかかわらず、Game Awards のフィナーレとして発表されたこの発表に対する反応は、賛否両論だった。 多くの視聴者は、これまで知られていなかったライブサービスヒーローシューティングゲームを、今年最も重要な授賞式の締めくくりとして選ぶことは、期待はずれだと感じた。しかし、より多くの情報や実際のゲームプレイによって大きな懐疑論を払拭する代わりに、開発者たちは沈黙を守っており、それは、発売が間近というよりも、プロジェクトが中止になったことを思わせるものだった。 Steam ページ には、現在、いくつかの画像と簡単な説明しか掲載されていません。 Apex Legends...

CD Projekt、Cyberpunk 2077 VR MODに対してDMCAで対応

CD Projekt Red は、Cyberpunk 2077 のバーチャルリアリティ改造に対して DMCA 通知を発行しました。この通知の対象となったのは、モッダーの LukeRoss による VR モッドで、以前は Patreon プラットフォームで提供されていました。この通知を受けて、このモッドは削除されました。 モッド開発者による確認 LukeRoss は、Patreon への投稿でこの件を確認しました。彼は、最終的に DMCA 通知の発行と VR...

「何を変えられるか?」 次のハードウェア大手は、Steam Deckに対抗する自社製品を開発しようとしている

Gigabyte は自社製のゲーミングハンドヘルドの開発を検討しているが、明確な差別化要素がなければ製品化は行わないと明言している。 ギガバイトは、独自のゲーミングハンドヘルド端末の開発を検討している。これは、ラスベガスで開催された CES 2026 での PCWorld とのインタビューで、エディ・リン CEO が確認した。世界有数のハードウェアメーカーである台湾のハードウェア企業は、急成長しているモバイル PC ゲーム機市場を注視している。 しかし、リン氏は「Aorus」ハンドヘルドは、Gigabyte が独自のものを開発できる場合にのみ発売されるとも明言しています。 Gigabyte は「他社の追随」製品は望んでいない リン氏は、「ハンドヘルドデバイスの製造は難しくない」と基本的に説明し、すでに同様のデバイスを製造している多くの中国メーカーを例に挙げています。 実際の課題は別のところにあるとリン氏は言います。「重要なのは差別化、つまり、他社とは何が違うのか、という問いです」 この文脈で、CEO は、ブランドアイデンティティを大切にし、単に「私たちも」というデバイスを市場に投入するだけではいけないと主張しています。この姿勢は、現在の市場を見れば理解できます。Steam Deck、Asus ROG Xbox...