11.8 C
Berlin
水曜日, 5月 20, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

バッド・スペンサーとジョン・トラボルタの共演:Steamで発見した隠れた名作が、強烈なパンチを食らわせてくる

ディスコと強烈なパンチ:久々に最高のゲームの組み合わせだ!普段は、単なる格闘ゲームにはあまり興味がないんだ。アクションゲームやRPGでの激しい戦闘はいつでも歓迎だけど、古典的なビートエムアップとかは、あまり私の好みじゃないんだ。だから、Steamの新着タイトルで『Dead as Disco』を見つけた時、最初は退屈そうにスクロールして通り過ぎてしまった。ストーリーもあまりない、派手な格闘ゲーム?いや、結構です!それに、とにかくまだ手付かずのゲームが多すぎるし。でも、そこで私の「チリ・シン・カルネ」が現れた。耳に残る曲と共に楽しむ夕食というか、むしろ:私の料理という副業。というのも、キッチンに立ち、ジャガイモやレンズ豆などが煮えるのを見守りながら、スマホを取り出してTikTokをドムスクロールしていたからだ。「20分で完成」と謳いながら、実際にはいつもそれ以上かかる定番のレシピに加え、Dead as Discoの動画も次々と流れてきた。そして、キッチュなスカル柄のレザージャケットを着たイケてる男が、まるでリンキン・パークの『The Emptiness Machine』のビートに合わせて敵の大群を粉砕する様子を見て、思わず足もリズムに合わせて揺れてしまった。さらに別の動画。今回はリッキー・マーティンの『Livin' La Vida Loca』。またしても、最後まで画面に釘付けになってしまった。そのチリ・シン・カルネがとっくに胃袋に収まった後も、この曲は頭から離れなかった。そこで、夕食の後、再びPCに向かってSteamを開いた。そこでようやくこれまでのSteamレビューを見て、かなり驚かされた。信じられないほどの93%が好評価!デモ版もありましたさて、こうして私たちはここにいますダンスフロアでのバッド・スペンサー・スタイル『Dead as Disco』は、SteamやTikTokで見た通り、本当に素晴らしいゲームです。プレイヤーはチャーリー・ディスコを演じます。かつての音楽界のスーパースターである彼は、バンドの仲間たちに冷酷に裏切られ(おそらく殺された?)、今まさに彼らにナックルサンドで仕返しをしようとしているのです。カウンター、回避、そしてコンボを駆使して、様々なボス戦を勝ち抜いていきます。そこで何より重要なのが、絶妙なタイミングだ。ただやみくもにボタンを連打するのではなく、特に高レベルでは一撃一撃を慎重に考えなければならない。というのも、蒸気ハンマーの伝説、バッド・スペンサー本人さながらに攻撃を繰り出すものの、残念ながら私はそれほど打たれ強くないからだ。その代わり、私は『サタデー・ナイト・フィーバー』のジョン・トラボルタのようにダンスフロアを駆け巡るため、K-POPスターたちも私からいくつか見習うところがあるはずだ。レベルを進むにつれて繰り返される様々なシーンの切り替えは、特に雰囲気がある。ぜひ、ご自身の目で確かめてみてください:ちなみに、ここでは「イージー」モードでプレイしていることをご容赦ください。「ノーマル」モードはかなり手強いので、皆さんの前であまり恥をかきたくなかったんです!2つの拳と、ハレルヤを呼ぶためのアップグレード『Dead as Disco』は現在まだアーリーアクセス段階にあるため、現時点では4体のボスとしか戦えません。しかし、その演出が素晴らしく、何度でも連続で戦っていても飽きません。もう一つの見どころは、曲が終了するまで拳を振り続ける「カスタムモード」です。これは、自分のハードディスクからゲーム内に読み込んだ音楽でも利用可能です。『Dead as Disco』は(現時点では)100時間も遊べるようなゲームではありませんが、その代わり、私がここしばらくプレイした中で最も楽しい気分転換を提供してくれます。さらに、新たなボスやスキル、ストーリーの追加といった新機能もすでに発表されています。もしディスコフィーバーに感染するかどうかまだ迷っているなら、まずはデモ版を試してみるのも良いでしょう。もしリズムに合わせて拳を振り回すようなゲームがしたいなら、『Dead as Disco』は最高の選択です。そして、「またチリを作ろうかな」と思っている方へ:コメント欄でレシピを喜んでお教えします。

Steamの新着情報:バットマン、ウォーハンマー、フォルツァ――今週はあなたの財布にとって危険な一週間になりそうです

今週のSteamでは、大作タイトルや隠れた名作が多数登場し、レースゲーム、ストラテジー、協力プレイファン向けの作品も豊富にラインナップされています。今週のSteamは、あなたの自由時間を容赦なく奪い去るでしょう:大作、XCOM風の戦闘、協力プレイのシューティング、ストーリー重視のRPG、そしてかなりユニークなインディーゲームなど、今回はほぼすべての好みに合うタイトルが揃っています。そして、そう、おそらく多くの人が予想していなかったカムバック作品も登場します。いつものように、今週の最も注目すべきSteamリリースを紹介します。そう、今回はウィッシュリストがまた少し長くなるかもしれません。クイックナビゲーション今週のハイライト:Forza Horizon 6 今週のその他の注目Steamリリース 5月18日(月) 5月19日(火) 5月20日(水) 5月21日(木) 5月22日(金) 今週の注目タイトル:Forza Horizon 6(ジャンル: レースゲーム -開発元: Playground Games -発売日: 2026年5月19日 (Steam)長年にわたり、ファンは『Forza...

『オーバーウォッチ』10周年記念イベントを巡る騒動についてブリザードがコメント

『オーバーウォッチ』は10周年を迎えたが、残念ながらファンからの評価は芳しくなく、これを受けてゲームディレクターが、今後数週間のうちにブリザードがどのように問題を解決していくかについてコメントした。ここ数日、『オーバーウォッチ』の10周年記念イベントが、期待外れの報酬やコンテンツの不足によって台無しにされたため、ファンからの不満が高まっています。『オーバーウォッチ』ディレクター、10周年記念イベントの変更を約束皆さん、こんにちは。今週、記念イベントに対する皆さんの反応を拝見してきましたが、その声は当然のものだと思います。『オーバーウォッチ』の10周年は大きな節目であり、私たちはこの1年全体を『オーバーウォッチ』のお祝いとして感じてもらいたいと考えています。 1/8— Aaron Keller (@aaronkellerOW) 2026年5月15日ファンからの反発は甚大であり、オーバーウォッチのゲームディレクターであるアーロン・ケラー氏は、この論争に対処し、ブリザードがファンとの関係を修復するためにどのような措置を講じるかを説明するため、ソーシャルメディアに投稿しました。アーロン・ケラー氏はTwitter上で、『オーバーウォッチ』10周年記念イベントに対する批判は正当なものであり、報酬は単なる戦利品ボックス以上のものであるべきだと述べた。その対策として、ブリザードは第2週のコミュニティ戦利品ボックスの数を2倍にし、第3週には3倍に増やすとともに、すべての戦利品ボックスを獲得するために必要な試合数を60に引き下げる。さらに、第3週には、伝説のスキン4つが確実に手に入る「10周年記念ループボックス」が配布される予定であり、イベント期間中にプレイすることで合計10個の伝説のスキンが獲得可能となる。今後の展望について、ケラー氏は、ブリザードが今年後半に『オーバーウォッチ』向けにさらなるコンテンツを用意しており、チームは1年全体を見据えていると述べ、今後さらに大規模で充実した報酬が提供される可能性を示唆した。しかし、『オーバーウォッチ』ファンの多くは、これだけではまだ不十分だと感じているようだ。中国の『オーバーウォッチ』ファンは、神話級シャードが報酬として得られるログインボーナスを含む、全く異なる10周年記念イベントを享受しており、ログインボーナスとして最大10個の神話級スキンも獲得できる。言うまでもなく、世界中の『オーバーウォッチ』ファンは、自分たちがはるかに充実したイベントを逃していると感じており、なぜ現在のイベントが中国版と同じにならないのかと疑問を抱いています。さらに、『Marvel Rivals』が1周年を記念して新モードや多数のスキン、通貨報酬を用意したのと比較すると、『オーバーウォッチ』のファンは、10周年のお祝いとしては、今回のイベントは依然として非常に物足りないと感じています。しかし、『オーバーウォッチ』はいつでも正しい方向へと舵を切ることができます。ブリザードは、論争や様々な挫折にもかかわらず、プレイヤー数の低迷から常に立ち直れることを幾度となく証明してきました。方向転換のタイミングを見極められなければ、10年も続かなかったでしょう。コミュニティが祝うべき機会であるはずの『オーバーウォッチ』10周年記念イベントが、善意から企画されたにもかかわらずこれほどがっかりする内容になってしまったことは、ただただ悔やまれるばかりです。