7.9 C
Berlin
金曜日, 2月 27, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

突然、ブリザードが「オーバーウォッチ ラッシュ」を発表しました。私はすでにプレイしています。

ブリザードの極秘プロジェクトが明らかになりました。その名は「オーバーウォッチ ラッシュ」。ゲームプレイとリリースに関する重要な質問すべてにお答えします。 私はまるで秘密捜査官のような気分だ。カリフォルニア州アーバインにあるブリザード本社で、私はひそかに脇に呼ばれた。実は私は、ここ数日間、ブリザードの重要な新プロジェクト、つまり「ディアブロ」のウォーロックや「ハースストーン」の新しいセットなどを視察している大規模な報道陣の一員だ。金曜日の正午、カリフォルニアの1月の太陽が、冬の気温28度の中で私の首筋を焼くように照りつけ、プログラムは正式に終了しました。しかし、私にとってはそうではありませんでした。 ブリザードの社員が私をグループから連れ去ります。その理由を誰にも説明してはいけません。メインの建物に戻り、迷路のような通路を抜け、護衛から離れて、どこにも人影は見当たりません。実際には目隠しだけが残っていますが、そうしたら、クールなウォークラフトやディアブロの胸像をじっと見つめることができません。 この長い旅は突然終わりを迎え、二重扉が開き、ブリザードのボス、プロジェクトリーダー、開発者たちでいっぱいの会議室が私を迎えてくれた。他にも3人の報道関係者が私と一緒にそこに座っている。Game InformerとGamespotはアメリカを担当し、もう1人のジャーナリストは日本を担当し、私はヨーロッパ全体を代表してここに座っている。私の社会科の先生がこれを見たら、きっと驚くでしょう。 ジョン・サレラが私に握手をしてくれます。彼はこの業界のベテランで、バトルフィールド 3、マスエフェクト、マッデン、そしてここ数年は複数のブリザード製品に携わっています。サレラは、フットボールのコーチ(ジェッツではなく、ペイトリオッツの)のようなカリスマ的な笑顔を持っています。それは当然のことでしょう。なぜなら、彼は、これまでで初めてとなるまったく新しいオーバーウォッチのプロジェクト、オーバーウォッチラッシュを私たちに売り込んでいるからです。 オーバーウォッチ ラッシュとは? 実際には、オーバーウォッチラッシュはオーバーウォッチモバイルという名前でもよかったのですが、その背後にはおそらく意図的な決定があったのでしょう。オーバーウォッチラッシュは、例えばコールオブデューティモバイルがコールオブデューティの大作であるように、大作オーバーウォッチの「小型」バージョンという位置付けは明らかにありません。グラフィックが簡略化された一人称シューティングゲームではなく、オーバーウォッチの世界観の中でまったく新しい体験が待っています。 ラッシュは、ポケモンユナイトやドラゴンボール ゲキシン・スクワッド、つまりモバイル MOBA を最も彷彿とさせるが、レベルアップの要素はまったくない。オーバーウォッチ ラッシュはよりストレートである。オーバーウォッチのヒーロー、たとえばソルジャー76 などを選び、鳥瞰図の視点から戦闘に飛び込む。通常、4 対 4 で対戦します。Blizzard は、これまでに以下のモードを確認しています。 コントロールでは、コントロールポイントを制圧し、それを維持します。これは、他のあらゆるマルチプレイヤーゲームでおなじみの、古典的なモードです。 ナノグラブでは、マップ上でトークンを集め、特定の場所でそれを現金化します。 Free for all では、4 人のプレイヤーだけがマップ上を走り回り、お互いに撃ち合います。 将来的には、Team Deathmatch...

プレイ:オフロードゾンビシューティングゲーム「Toxic Commando」は、ワイルドなアイデアと巨大なマップが魅力

ジョン・カーペンターの「Toxic Commando」は、協力プレイシューティングゲーム、マッドランナー、そして「ワールド・ウォー Z」のような巨大なゾンビの波を融合したゲームです。Steam Next Fest でデモ版をプレイしました。 ジョン・カーペンター。この名前は、80年代の伝説的なホラー、轟くシンセサイザー、そして「ハロウィン」や「遊星からの物体X」などの忘れがたい映画の名作を象徴しています。今、このカルト的な監督が、その陰鬱なビジョンをまったく新しい協力プレイシューティングゲームに活かしています。 開発元の Saber Interactive は、このプロジェクトのために、さまざまなジャンルで蓄積してきたスタジオのノウハウを結集しています。World War Z の巨大な敵の群れと、Snowrunner の容赦ない泥濘や車両の物理演算が衝突し、その結果が John Carpenter's Toxic Commando です。 3 月の正式リリースが間近に迫っていますが、現在の...

2026年のゲーム見本市とイベント:ゲーマーのための究極のスケジュールカレンダー

もちろん、2026年もビデオゲームファンにとってエキサイティングなゲームショー、発表イベント、見本市が数多く開催されます。ここでは、最も重要な日程をまとめました。 2026年もゲーマーにとってエキサイティングな年になることが予想されます。世界中で数多くのゲームフェアやイベントが開催される予定です。今年もイベントを見逃さないよう、重要な日程をまとめてご紹介します。 この概要は、新しい情報が入りましたら、随時更新・追加いたします。 このリストには、ライブストリームが提供されていない、または大きな発表が見込めないローカルイベントは含まれていません。目次から、ご興味のあるイベントをすばやく見つけることができます。 2026 年の主なゲームイベント概要 Nintendo Treehouse ライブストリーム (2月24日) Future Games Show 2026 (3月12日) PAX East (3月26日から29日) BAFTA Games Awards (4月17日) CAGGTUS Leipzig (4月17日~19日) ~Computerspielpreis 2026 (4月29日) TwitchCon Europe (5月30日~31日) サマーゲームフェスト 2026 (6月5日) PC Gaming...