30.2 C
Berlin
土曜日, 6月 20, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

『GTA 6』の発売日、ある企業が全従業員の業務を停止――「そうでなければ、どうせ全員が病欠になるから」

『グランド・セフト・オート6』のために休み? 単なる願望のように聞こえるこのアイデアを、ある企業が全従業員を対象に実現させた。『GTA 6』は2026年11月19日に発売されます。本来ならごく普通の木曜日であり、多くの人にとっては平日です――特に休暇の申請ができない場合、多くのゲームファンにとっては悩みの種となるでしょう。しかし、Burger Motorsports社は、多くの従業員がこのことを理由に待ちきれない様子であることに気づき、即座に『GTA 6』を文化的なイベントと宣言することを決定しました。ニュースサイト「Pubity on X」の報道によると、この日、同社は全社員に休日を与えるとされています。速報:『GTA 6』の予約受付開始日が決定しました。来週から、コンソール版『グランド・セフト・オート6』の予約が可能になります!GTA 6をプレイするために全員が休みになるGTA 6の発売日に、多くの従業員が欠勤したため、会社全体が業務を停止することになった。バーガー・モータースポーツ社はこれを「前例のない文化的イベント」と位置づけ、従業員に無理に働かせるのではなく、11月19日を全員に休暇とすることを決定した。pic.twitter.com/yMzc7nFid3 — Pubity (@pubity) 2026年6月18日このXの投稿には、6月11日付でバーガー・モータースポーツの従業員およびパートナー宛てに送られた社内通知が掲載されている。その通知によると、11月19日に社内で多くのスケジュールの重複が発生していることが判明したとのことです。一部の従業員が、その日は連絡が取れない、あるいは単にバイスシティにいると伝えていたため、同社はついに断固たる措置を講じ、この事態をユーモアを交えて受け止めています。そこで、ささやかな譲歩として、全員に休みを与えることにした。従業員たちが最初の探索ツアー、あるいは少なくとも1つのミッションを完了し、徐々に現実世界に戻ってきた時点で、通常の業務を再開する。このXの投稿には、6月11日付でバーガー・モータースポーツの従業員およびパートナー宛てに送られた社内通知が掲載されています。そこでは、11月19日に社内で多くのスケジュール上の衝突が発生していることが判明したと説明されています。一部の従業員が、その日は連絡が取れない、あるいは単にバイスシティにいると伝えていたため、同社は今、断固たる措置を講じ、この事態をユーモアを交えて受け止めています。そこで、ささやかな譲歩として、全員に休みを与えることにしました。通常の業務は、従業員が最初の探索ツアー、あるいは少なくとも1つのミッションを完了し、徐々に現実世界に戻ってきた時点で再開されます。ゲームのリリースが祝日になる?しかし、X上のコメントでは、これを単なる従業員への譲歩とは見なしていない。例えば、iGrandTheftAuto.comは次のように書いている:賢いマーケティングの仕掛けだ。彼らは間違いなく、これで求めていた注目を集めることに成功した。だが、たった1日何の意味があるというのか?もし私が従業員だったら、100%達成するまでは戻らないだろう。一方、これほど皮肉な見方をせず、企業と同じくらいユーモアを交えてこの不条理な状況を受け止めている人々もいる。例えば、ユーザーDubaは次のようにコメントしている:このままいけば、GTA 6は祝日のように扱われるようになるだろう。JohnFalloutもコメントで同様の見解を示している:100年後には、GTA 6が私たちの社会にどのような影響を与えたのかが研究されるだろう。もちろん、GTA 6をクリアするには1日では到底足りない。しかし、このちょっとした「前味」があれば、多くの人は金曜日を乗り切って週末を迎え、そこで本格的にプレイを始められるかもしれません。いずれにせよ、これは魅力的な気遣いで、Xではこれまでに5,000件近くの「いいね!」を集めています。GTA 6のリリース当日、休みを取りますか?それとも、真面目に仕事が終わるまで待ちますか?コメント欄で教えてください!もし『GTA 6』の発売が再び延期されれば、大混乱や休暇の予定変更を招く可能性もあります。これについては、前回の予定発売日についてフィルがすでに書いています。『Grand Theft...

State of Unreal 2026:Epicの基調講演の重要情報を3分で総まとめ

「State of Unreal」では、Epic GamesがUE6を少しだけ披露しただけでなく、Unreal Engine 5.8に関するいくつかのシステムも紹介しました。「State of Unreal 2026」は終了し、Epic Softwareの未来について2時間以上にわたる展望が示されました。Unreal Engine 6については比較的短く触れられたものの、開発者たちはUE 5.8という(おそらく)最後の大型アップデートについて多くを語りました。基調講演で発表された重要な新情報を、以下のクイックまとめでご紹介します。Unreal Engine 6:大まかなスケジュールが決定Unreal Engine 6について、Epic Gamesはロードマップを公表しました。EpicのCEOであるティム・スウィーニー氏によると、次期エンジンはUE5と、『フォートナイト』で並行して開発されているパイプラインを統合する予定です。これには、プログラミングモデル「Verse」、ポータブルコンテンツ向けのオープンスタンダード、MCPによるAIのより深い統合が含まれます。Epic Gamesによると、早期アクセスは引き続き2027年末に予定されているとのことです。Unreal...

ターン制戦略&宇宙船建造:『Down with the Ship』のSteamデモを12時間プレイした結果、開発者に間違いなく15ユーロ払うべきだと確信した

無料なのに驚くほど内容が充実していて、本当に面白い。『Down with the Ship』のデモ版は、Steamにおける隠れた名作だ。「ちょっとだけ」デモ版をダウンロードして、GlobalESportNewsのコメント欄でみんなが何をそんなに絶賛しているのか見てみよう、と思うことがある。ところが3時間経ってもまだその場に座り込み、プラズマランチャーを10回目はあろうかと思うほど左に1ピクセルずらしている自分に気づく。そうすれば、1つのリアクターではなく2つのリアクターに接触できるからだ。まさにそんな体験を、私は『Down with the Ship』(Steamでのゲームページ)でまさに同じことが起こりました。でも、その決断を1分たりとも後悔していません。一体どんなゲームなのか?仕組みは簡単に説明できます:Iron Anchor Gamesのこのゲームは、オートバトラーです。プレイヤーは自分だけの宇宙船を組み立て、あらゆるガジェットを詰め込み、他のプレイヤーの船と戦わせます。各ラウンドごとに、ショップから新しいパーツが登場します: 砲台、リアクター、乗組員、呪われた遺物、そしてあらゆる奇妙なアイテム。その場その場で適したものを購入し、少しずつ自分の船を「空飛ぶ要塞」へと拡張していきます。ここで最も重要なのが配置です:パーツがどこに配置されるかによって、それが機能するかどうかが決まります。なぜなら、モジュールは隣接関係や接続を通じて効果を発揮するからです。適切なリアクターの隣に配置された砲台は、突然2倍の速さで発射するようになります。効果は連鎖し、ボーナスは積み重なり、同じパーツでも配置次第で全く異なる戦略が可能になります。すべての配置が完了したら、「戦闘」ボタンを押して操作を委ねてください――戦闘は自動的に進行します。つまり、その緊張感のすべては、あなたの構築物が事前に十分に賢く設計されていたかどうかにかかっているのです。戦闘は、実際のプレイヤーが保存した艦船と非同期で行われます。つまり、AIのダミーと戦うことは決してなく、常に他の人々の悪知恵と戦っているのです。キャプテンと陣営各プレイ開始前に選択するキャプテンによって、さらにバラエティ豊かなゲーム体験が楽しめます。すべてのリーダーは、異なる船体形状、独自のパッシブスキル、そして様々なビルドパスを備えています。キャプテンは常に4つの陣営のいずれかに所属しています:各陣営には独自のアイテムプールとアイデンティティがあり、ある陣営は純粋な火力を重視し、別の陣営は持続ダメージ効果を重視しています。特定の陣営の装備に全面的に頼ることも可能です。各パーツは互いに調和しており、ボーナスも相互に作用するため、確実に機能します。あるいは、実験的に他陣営のパーツを混ぜ合わせ、予測不可能な組み合わせを作り上げることもできます。失敗する可能性もありますが、誰も予想できない圧倒的なコンボが生まれる可能性もあります。デモ版は試す価値があるか?もちろん!この無料体験版には驚くほど多くのコンテンツが用意されています:12人のキャプテンのうち3人が登場。それぞれ独自のレイアウトと能力を持っています本編に収録されている200種類以上のアイテムの中から、118種類を試すことができますプレイヤーが作成した船と対戦し、ライフが尽きる前に10勝を目指す「バーサスモード」 10勝を達成した後も、船体が完全に崩壊するまでプレイを続けられる「エンドレスラン」モードまた、隔離されたデモ版の世界でプレイするのではなく、本編のプレイヤーと同じエコシステムで直接対戦できます。ランクマッチのマッチメイキングにそのまま放り込まれるデモ版――これは珍しいことで、ゲームを手放すのがさらに難しくなります。これだけのコンテンツがあれば、何晩も簡単に没頭できてしまいます――そして、まさにそこに私の問題があります。プレイするたびに「いや、買わない。すぐに飽きてしまうに違いない」と思うのですが、それでもまた何度もプレイしてしまうのです。そろそろ、ソロ開発者のIron Anchor Gamesに15ユーロを支払うべき時期が来ています。遅くとも、次のSteamサマーセールまでには、きっと我慢できなくなるでしょう。