7.6 C
Berlin
日曜日, 3月 15, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

ついに正式発表:次期XboxはゲーミングPCとなり、前世代機より2つの点で優れている

マイクロソフトは、ゲーム開発者会議(GDC)において、次期Xboxコンソールに関するさらなる詳細を明らかにした。 次世代Xboxコンソールでも、ノスタルジーと次世代グラフィックのどちらかを選ばなければならないと思っていた人は、その考えが間違っていたことを知ったでしょう。今年のゲーム開発者会議で、マイクロソフトは昨日、ゲーム部門の将来について公式に発表しました。 Xbox担当副社長のジェイソン・ロナルド氏は、は、コードネーム「Project Helix」と呼ばれる次世代Xboxの詳細を明らかにしました。AMDとの緊密な提携により、この新しいコンソールはレイトレーシング性能において飛躍的な向上を実現するだけでなく、これまでのすべてのXbox世代との下位互換性も向上させる予定です。 AMD の AI アップスケーラー FSR Diamond に注目 PCとコンソールのハイブリッド機は、AMDのAIアップスケーラー「FSR Diamond」に対応する。ロナルド氏は、Microsoftが新型Xboxで レンダリングとシミュレーションの限界を拡大する と約束しており、パフォーマンスにおける飛躍的な進歩についてさえ言及している。 AMDのコンピューティングおよびグラフィックス担当シニアバイスプレジデント兼ゼネラルマネージャーであるジャック・フイン氏は、Xへの統合のメリットを次のように説明している: 次世代ニューラルレンダリング向けに設計。 次世代MLベースのアップスケーリング 新しいMLベースのマルチフレーム生成 RTおよびパストレーシング向けの次世代レイ再生成。 🚀 ゲーミングの未来にとって大きな瞬間です。@Xbox および @asha_shar と「Project Helix」で提携できることを大変嬉しく思います。これは、次世代のパフォーマンス、画期的なグラフィックス、そして既存のXboxゲームライブラリとの互換性を実現するための、数年間にわたる深い共同エンジニアリングパートナーシップです。これを支えるのは… pic.twitter.com/twGyonqgQS—...

ニューヨーク州によるSteamへの提訴:Valveが公式声明を発表し、反撃に出る

2月にニューヨーク州検察局がギャンブルに関する疑惑でValveを提訴したことを受け、Steamの運営元であるValveは声明を発表し、自社の「ルートボックス」を擁護した。 Valveは現在、米国で多くの問題を抱えている。ニューヨーク州司法長官は、Counter-Strike、Dota、Team Fortress のパブリッシャーが提供するルートボックスを、一種の違法な賭博とみなしており、Valve を提訴した。 検察当局によると、同社はルートボックスを通じて賭博に関する法的規制に違反しているだけでなく、この仕組みによって子供たちがゲーム依存症に陥ることを容認しているという。この訴訟の目的は、Valveがゲームからルートボックスを削除し、被害を受けたニューヨーク州のSteamユーザー全員に賠償金を支払うことにあるとされる。 提訴から2週間後、Valveは初めてこの申し立てについて自らコメントした。 ポケモンカードやラブラブのようなもの Steamのサポートページにある公式声明 Steam のサポートページで、Valve は、いわゆるミステリーボックスはニューヨーク州の法律に違反していないと信じていると述べている。 また、Valveは検察当局に対し、 仮想アイテムやミステリーボックスの性質について理解を深めてもらうべく最善を尽くしたにもかかわらず、事態が法廷での争いへとエスカレートしたことに失望している。Q Valveの声明によると、同社は2023年初頭に初めて検察当局から連絡を受けたという。 同社は当局に対し、現在では「ビデオゲームだけでなく、実生活においても」ルートボックスが一般的な慣行であることを明確に伝えようとしたという。 同パブリッシャーは声明の中で、ポケモンやマジックのカード、そして同じ原理で機能するラブブスにも言及している: いずれも封印された箱に入っており、顧客は事前に中身が何であるかを知ることができない。 さらに、Valveのルートボックスには装飾アイテムしか含まれていないため、ボックスを購入しなかったプレイヤーに不利益が生じることはない。また、誰もボックスを開けることを強制されることはない。 「当社はギャンブルサイトとは提携していません」 Valveはさらに、Valveのゲーム内のアイテムが使用されるサードパーティのプラットフォーム上での実際のギャンブルに対して、厳格な措置を講じていることを指摘している。同社によれば、これは Steam利用規約への明らかな違反である。 Steam運営陣はこれまでに、ギャンブル、詐欺、窃盗にアカウントを悪用したユーザーに対し、100万件以上のアカウント停止処分を下している。さらに、Valve は、不審なサードパーティやギャンブルサイトに対して、取引の制限などの機能を導入し、その活動を困難にしています。 論争点 コミュニティマーケットプレイス Valve は、化粧品アイテムの取引を完全に禁止するよう求める検察側の要求に特に強く反対している。Valve は、これを消費者権利の重大な侵害とみなしている。「譲渡可能性は、私たちの意見では奪うべきではない権利であり、私たちはそれを奪うことを拒否します」と同社は明言している。 物理的なトレーディングカードを所有している人は、最終的にはそれを自由に転売できるべきである。 Valve は、検察庁が要求する年齢および所在地のより厳格なチェックも拒否している。同社は、ニューヨークからの VPN アクセスを阻止するためだけに、世界中のすべての Steam ユーザーに対してそのようなチェックを導入することを拒否している。 Valveは次のように記している。「検察当局と和解する方がコスト的には安上がりだったかもしれないが、それは当社のプレイヤーや開発者に甚大な損害を与え、自身のイノベーション能力をも阻害することになっただろう。最後に、Valve はさらに一撃を加えています。検察は、Counter-Strike などのゲームが現実世界での銃による暴力を助長していると主張していました。Valve...

まったく新しい「ディアブロ2」:誰かが、このアクションRPGをUnreal Engineで「Skyrim」風に作り変えようとしている

従来の「ディアブロ」は、すべてトップダウン視点でプレイされます。ある人物が、一人称視点への切り替えを真剣に試みています。 最初のディアブロ以来、カメラアングルは常に固定されていました。アイソメトリックな視点から、斜め上からヒーローたちを見下ろし、彼らが地獄の悪魔たちを相手に凄惨な殺戮を繰り広げる様子を眺めるのです。 しかし、それを変えようというアイデアも以前からありました。たとえば、ディアブロ 3 の発売直後に中止となったプロジェクト・ハデスでは、その試みが注目されていました。これは、ダークソウルを少し彷彿とさせる、サードパーソン視点のゲームとなる予定でした。 現在、あるソロ開発者が新たな試みとして、ディアブロ 2 を 一人称視点のロールプレイングゲームに作り変えようとしています。YouTube では「I Make Games」として知られ、ここ数週間、Unreal Engine 5 のおかげでグラフィックも非常に魅力的な短いゲームプレイビデオを定期的にアップロードしています。 これは一体何になるの? 表示されているシーンは、よくあるような、Unreal Engine による単なる技術デモではありません。開発者は実際にゲームの開発を計画しています。その進捗状況を開発者日記で公開し、コミュニティにこのゲームに何を期待するかを直接尋ねています。 公開されたシーンは、すでに大きな反響を呼んでいます。多くのディアブロファンが、まさにこのような実験的なアクションロールプレイングゲームを待ち望んでいたようです。開発者はもちろん、お馴染みの音楽や『ディアブロ』にインスパイアされたインターフェースを主に使用しています。効果音も、一部の人には馴染み深いものになるでしょう。 印象的な物理演算の演出もクールです。例えば、この一人称視点の『ディアブロ』で火の玉が悪魔に直撃すると、その怪物は見事に粉々になります。開発者日記の中で、このソロ開発者は、一人称視点から三人称視点への切り替えも検討しているとほのめかしている。 彼は主に多くの提案を行い、人々が何に最も興味を持っているかを把握しようとしている。現在、多くのアセットについてはまだマーケットプレイスを利用している。彼によると、AIはほとんど使用されていないようだ。一部のキャラクターのメッシュだけがAIで生成されたものらしい。 これは現実的なプロジェクトなのか? 開発者はこのプロジェクトを真剣に考えており、いくつかの野心を持って取り組んでいるようです。しかし、彼は、単にディアブロのリメイクを作って販売することはできないことも認識しています。 彼によれば、ブリザード自身がこの流れに乗ってくれるという期待も少しはあるようです。つまり、開発者はブリザードがこのプロジェクトの可能性とコミュニティの関心を認識し、自らそのようなゲームを制作してくれることを望んでいるのです。 しかし、彼はディアブロプロジェクトを完全に独立したゲームにする可能性も否定していません。彼によれば、それはファンの期待次第だといいます。ファンプロジェクトのままにするか、本格的なゲームにするかは、フィードバック次第だということです。