0.9 C
Berlin
土曜日, 3月 28, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

テスト中のスクリーマー:『ニード・フォー・スピード』不在の中、リードフットのリブートはレーシングゲームとして的外れだった

新型「スクリーマー」は、由緒ある名前ではあるが、90年代のクラシックなレースゲームシリーズとはあまり関係がない。ただし、ここでもリードフットが限界までプッシュされている。部屋で脈打つ真っ青なクジラの象に直接話しかけてみよう: いや、この絶叫マシンは、古くからある同名の海外レースゲーム(「Bleifuss」として知られ、私たちに愛されている)とはまったく関係がない。たしかに、どちらのゲームも速いクルマがテーマだし、当時も今も、マイルストーンのイタリア人がこのゲームの開発に関わっている。でも、またそれだけなんだ。それなのになぜレビューを書くのか? なぜなら良いアーケードレーサーが不足しているからで、『Need for Speed』は氷漬けにされ、『Screamer』は喝采を浴びないかもしれないが、それでもロードに馬力を注いでいる。GlobalESportNewsは、このゲームが買う価値があるかどうか、そして誰のために買う価値があるかどうかをお伝えします。Cash for Fahresスクリーマーの目玉は「トーナメント」だ: ディストピア的でブレードランナー的な、そう遠くない未来のある日、謎めいた 「ミスターA 」が、いわゆる 「スクリーマー 」のグループが互いに競い合うカーレースを主催する。「Green Reapers」、「Strike Force Romanda」、「Kagawa-Kai」、「Anaconda Corp」といったチーム名で、それぞれが大会に参加する理由を持っている。ある者は殺されたメンバーの復讐を、またある者は名声と名誉を求める。そして、その全員が、総額1000億ドル(※メモをチェック)もの賞金に興味を持っている。この安定した賞金を手に入れるため、あなたは全チームのさまざまなドライバーになりきる。各チームのマシンを操り、特定のラップタイムを達成したり、記録を更新したり、表彰台の特定の場所を目指したり、ドリフト中にブーストを発動させたり、チームレースで勝利したりと、さまざまなミッションをこなさなければならない。ディストピアの森の中の宝石。あるミッションでは2位に500メートルの差をつけながら問題なく勝利し、次のミッションではドライビングミスをほとんど犯さず、ギリギリ3位に食い込んだ。また、比較的少ないトラックで移動します。4つの異なるシナリオがあり、32のトラックは環境の他の部分を部分的に使用しているだけです。いずれにせよ、全体的にとても良くできている: アクションは外から眺めるだけだが、そこからの猛スピードとクラッシュのエフェクトは実によく見える。そして、全体がミッドレンジのシステムでも高いディテールレベルで素早く安定して動作する。ただ、美しく演出されたトラック以外に見るべきものがあまりないのは残念だ。初代『Screamer』(初代『Ridge Racer』を大きくベースにしている)を思い起こせば、飛行機やヘリコプター、ケーブルカーが画面中を疾走し、いたるところで何かが起こっていた。ここにはそんなものはない。他と同じようなレースゲームはない。大会の中では、レース、復讐、富をめぐる筋書きが非常に大きな役割を果たしている。実際、あまりに大きいので、短いレースがフィラーのように感じられることもある。レースの前後には、主にサイドビューからの会話カットシーンで、ほとんど無限に話しかけられるが、日本の有名なアニメスタジオが制作した非常にしっかりとしたショートムービーでも繰り返し登場する。ポリゴン・ピクチュアズ(『トロン:アップライジング』、『愛と死とロボット』など)。プロットの特別な特徴は、『鉄拳8』のように、ほとんどすべてのキャラクターが異なる言語を話すことだ。英語からフランス語、イタリア語、スペイン語、ドイツ語、日本語まで、キャラクターが互いにコミュニケーションに少しも問題を抱えることなく、多くのことを聞くことができる。鉄拳』とは異なり、『スクリーマー』には少なくとも、このバベルフィッシュ・ワンダーランドに関するイチジクの葉のような説明がある。いずれにせよ、プロットはよくできている。そして、もしあなたができるだけ多言語であること、特に汚い言葉に関しては多言語であることを重視するのであれば、『スクリーマー』は素晴らしい教師である。というのも、この映画には本当にひどい悪態がいくつも出てくるからだ。しかし、長い目で見ると、すべてがちょっと多すぎて疲れる。私としては、ゲームとストーリーの尺度がもっとゲームの方向に振れていれば、もっと良かったと思う。少なくとも、雑談を聞きたくなければ、レースの中断はすべてスキップできる。アニメ『ドリフトマスター』トーナメントはストーリーの中心であるだけでなく、ゲームのチュートリアルでもある。Screamer』には、通常のレースゲームとは明らかに異なる、いくつかの特別な機能が用意されている。まず操作方法だが、これは『慣性ドリフト』の2本スティックシステムに非常にインスパイアされている。あのゲームでは、左スティックで普通に操縦し、右スティックでドリフトをコントロールする。一方、『スクリーマー』では、左スティックで普通に操縦し、右スティックでドリフトをコントロールする。さて、私たちは「インスパイアされた」というよりも「採用された」という話をしている。あちこちで、このシステムには慣れが必要だ。特にドリフトは、自分のクルマのコーナリングを驚くほど正確にコントロールできるが、同時に非常に正確なコントロールも要求される。カーブへの進入角度を間違えると、フルスピードで縁石に激突することになり、スピードが落ちるばかりか、時折超ワイドなリアスポイラーを犠牲にすることになる。しかし、何度か練習してドリフトをコントロールできるようになると、すべてがかなりクールに感じられるようになる。突然、フルスピードからドリフトできるようになり、縁石をほんの数センチ通り過ぎただけで、カーブの進路に沿って正確にドリフトできるようになる。そしてエコー・システムがあるからだ。ハローエコー!ハロー・スクリーマー!トーナメント中の「エコー」の紹介の仕方は実にくだらない。要約すると、「やあ、僕は君の知らないメカニックだよ。君たちの超高級スーパーカーに、僕より先に開発された装置を取り付けて、車が爆発してもすぐに蘇生できるようにしてあげるよ。クールだろ?かっこいい!」エヘン。なるほど。エコーはターボ・ブースト、テイクダウン、シールドと呼ばれるゲームメカニクスの集合体だ。これらのどれかを使えるようにするには、できるだけ巧みに運転したり、できるだけ正確にギアをシフトしたりすることで「シンク」エネルギーを蓄積しなければならない。これを使うと「エントロピー」がチャージされ、ショートシールドやオーバードライブに使える。ただし、このフェーズ中に壁に触れると、自分も炎に包まれる。古典的なリスクとリターンのシステムだ。これらすべてがゲームパッドのショルダーボタンに分散されており(ゲームでは強く推奨されている)、慣れるまでに時間がかかる。しかしありがたいことに、これは長いトーナメント中に徐々に導入されるだけだ。 <pアーケードが呼んでいる!。一方、すぐにでもアクションに飛び込みたいのであれば、アーケードモードがお薦めだ。ノーマルレースやチームレース、さまざまなチャレンジバリエーション、チェックポイントレースやタイムレースなど、長期的に全力で楽しむには十分すぎるほどの選択肢がここで待っている。しかし、トラックや車両はトーナメント内や常設のアーケードレースでアンロックされるため、最初のうちはほとんどコンテンツがありません。全体的にとてもいい感じだ。And...

ストーカー2、今夏に初の拡張版:「Cost of Hope」に2つの新地域と 「数十時間 」のゲームプレイを追加

『Stalker 2』が初のDLCを発表した。正確なリリース日はまだ未定ですが、すでにトレーラーとコンテンツに関する多くの情報が公開されています。『Stalker 2』は発売からすでに1年半近くが経過しており、大小さまざまなアップデートが行われています。何千ものバグ修正に加え、武器やクエストなど、驚嘆すべき新コンテンツもありましたが、開発者たちは今、次のステップに進もうとしています:大規模なストーリー拡張「Cost of Hope」が2026年夏にリリースされることが発表されました。これまでにわかっていることは?DLCの正確なリリース日はまだ決まっていませんが、コンテンツとストーリーに関する詳細はすでにいくつかわかっています。また、ミッションや新エリアを紹介するファーストトレーラーも公開されています。「Cost of Hope」はストーカー2を拡張し、マップ上で長い間厚い雲に覆われていた2つの新エリア、チョルノブイリ原子力発電所と鉄の森を追加します。チョルノブイリ原発と鉄の森だ。後者へのゲートもゲーム内にあるが、まだ開くことはできない。そのため、そこに何が待ち受けているのかはまだわからない。しかし、DLCのアナウンスでは曲がりくねった迷宮のような道が語られており、「鉄の森」を踏破するのは容易ではないだろう。新エリアではもちろん、独自のハブ、新しい武器や装備、DLCストーリーも期待できる。DutyとFreedomという2つの旧知の派閥がゲームの中心になるようだ。デューティはこのゾーンを、何としてでも封じ込め、破壊しなければならない脅威と見なしているが、フリーダムは人類のために探索すべき贈り物と見なしている。『希望の代償』では、派閥間の休戦協定が崩壊の危機に瀕し、スキフは両陣営の板挟みになる。典型的なストーカーの流儀では、事態はかなり厳しいが、その目的は希望の火花を散らすことでもある。私たちの決断はゾーンの未来を変えるだけでなく、全世界に影響を与えるはずだ。<プレスリリースでは、開発者は数十時間のゲームプレイについて語っています。その後どうなるのか?『Cost of Hope』は『Stalker 2』の最初のDLCですが、最後のDLCではありません。 開発者は、『Cost of Hope』は第2部作の中編だと説明しています。これはストーカー2のゲーム本編と、2つの主要なストーリー拡張で構成されている。リマンスクへの帰還についてファンの憶測が飛び交う中、2つ目の拡張のお披露目はもうしばらく待たなければならないだろう。しかし、『Cost of Hope』の正確なリリース日は近日中に発表される見込みだ。 <p

Ryzen 9 9950X3D2が正式発表されたが、AMDはPCゲーマーに2つの重要な疑問を残したままだ

AMDはRyzen 9 9950X3D2 「Dual Edition 」を正式に発表した。初めて3D-Vキャッシュを両方のCCDに同時に搭載し、192MBのL3キャッシュを実現した。しかし、希望小売価格とゲーミング性能に関する疑問は依然として解決されていません。両方のチップレットに3D-Vキャッシュを搭載したRyzen 9000プロセッサに関する噂は、昨年の夏から流れていました。AMD has kept a low profile with the exception of a subordinate clause...