20.5 C
Berlin
木曜日, 5月 28, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

『GTA 6』にリアルな警察の追跡システムが登場? おそらくそうだろうが、最新のリーク情報はデタラメだ

ロックスターは、新機能の痕跡をすべて消し忘れたのだろうか? ファンたちは『GTA Online』で不審な点を見つけたと主張しているが、すぐにそれが古いコードであることが判明した。GTAをプレイしたことがある人なら、ほぼ間違いなくゲーム内の警察の指名手配リストに載ったことがあるはずだ。ロス・サントスを数分間暴走し、5つの点滅する星が消えるまでトンネルに隠れていた経験があるかもしれない。『グランド・セフト・オート6』にも同様のシステムが搭載されるというのは、カジノのルーレットがそこにあるのと同じくらい驚くことではない。リーク情報や噂によれば、重要なデータを記憶できる警察による現実的な対応が約束されている。そこで、あるファンがGTAオンライン内でこの機能に関する具体的な手がかりを見つけたと主張し、複数のニュースサイトが報じました。しかし、これはどうやら誤報のようです。何が混乱を招いたのか?話題となったのは、あるRedditの投稿で、誰かがGTAオンライン内でGTA 6のテストの残骸と思われるものを共有した件だ。それは、個々の車両を特定できる車両識別番号(VIN)だった。https://www.reddit.com/r/GTA6/comments/1tn0v0r/potential_gta_6_feature_leaked_in_gta_online/? utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button元の投稿によると、このシステムはこれまでのところ、シングルプレイヤーのGTAシリーズやGTAオンラインには存在しないとのことです。しかしその後、別の投稿者が解明されたところによると、これはGTA 6から誤ってコピーされたコードではなく、2013年、つまりローンチ時からGTA Onlineの一部であったコンポーネントである。ただし、このテキストメッセージが表示されるのは、CHASSIS4スロットを持つ盗難車両において、特定の条件下でのみです。おそらく、当初計画されていた機能が縮小または削除された際に、コードの残骸がGTA Onlineに残ったものと思われます。つまり、GTA 6に関しては、引き続き大規模なゲームプレイ公開を待つことになるでしょう。RockstarとTake-Twoによると、2026年の夏には多くの疑問が解消される予定だ。しかし、具体的な日程はまだ発表されていない。2026年11月19日のリリース日は依然として予定表に記載されており、業界全体がこの日を心待ちにしている。

『ウィッチャー3:ワイルドハント』に新たなDLCコンテンツとアップデートが登場

CD Projekt Redは、最も有名なRPGの一つである『ウィッチャー3:ワイルドハント』に、新たなDLCコンテンツとアップデートが追加されると発表した。この発表は、同作が発売10周年を迎えようとしている中、今なお熱心なプレイヤー層を抱えている状況で行われたものである。今後のコンテンツと予想CD Projekt Redはまだ今後のコンテンツに関する具体的な詳細を発表していないものの、ファンたちは、拡張パックには新しいクエストだけでなく、追加のゲームメカニクスも含まれるのではないかと推測しています。コミュニティでは、これらの新要素が長年のゲーム体験にどのような影響を与えるかについて、すでに活発な議論が交わされています。開発者のコメントと期待CD Projekt Redの広報担当者は次のように述べています。「『ウィッチャー3』の遺産を受け継ぎ、プレイヤーの皆様に新たな冒険をお届けできることを大変嬉しく思います。」 この声明は、『サイバーパンク2077』などの新作タイトルがリリースされた後も、開発チームがゲームのサポートと拡張に継続的に取り組んでいることを強調するものです。今後のアップデートについてファンたちは今後のアップデートを心待ちにしており、すでに複雑で豊かな『ウィッチャー3』の世界がさらに深まることを期待しています。正確なリリース日はまだ発表されていませんが、詳細情報や公式発表は近い将来に行われる見込みです。よくある質問『ウィッチャー3』の新しいDLCには何が含まれますか?新しいDLCに関する具体的な詳細はまだ明らかになっていません。しかし、新しいクエストやゲームメカニクスが含まれるのではないかと推測されています。『ウィッチャー3』のアップデートはいつリリースされますか?新コンテンツの正確なリリース日はまだ発表されていません。『ウィッチャー3』のサポートは今後も継続されますか?はい、CD Projekt Redは『ウィッチャー3』向けのコンテンツやアップデートを引き続き提供していくことを確認しています。

「待った甲斐があった」:『Paralives』が7年ぶりに早期アクセスを開始、コミュニティは夢中になっている

このライフシミュレーションゲームが早期アクセスを開始し、Steamでの最初のレビューは期待が持てる内容となっている。2026年5月25日、Paralivesが早期アクセスを開始した。ファンはこれを長い間待ち望んでいた。7年間の開発期間を経て、ライフシミュレーション愛好家たちはついに、『The Sims』の新たなライバルとなるこのゲームを自らプレイできるようになった。ここでは、コミュニティからの最初の反応をいくつかご紹介します。まず結論から言うと:『Paralives』の評判は良さそうです。素晴らしい数字と、さらに素晴らしいレビューいつものように、まずは数字から見ていきましょう。この記事の執筆時点で、『Paralives』は3,800件以上のレビューSteam上で3,800件以上のレビューを集め、88パーセントの肯定的な評価を獲得し、「非常に好評」という認定を受けていますプレイヤー数も決して見劣りしません。SteamDBによると によると、Paralivesはリリース当日に78,603人という同時接続者数のピークを記録しました。この数字が今後数日間維持できるかどうかは、まだ分かりません。しかし、このようなスタートは確かに有利であり、レビューを見る限りでも期待が持てます。高く評価されている点:アートスタイルと全体的な「雰囲気」: Paralivesは情熱が感じられ、すでに実装されている機能の多くは、よく考え抜かれ、丁寧に組み込まれていると多くのプレイヤーに受け止められています。オープンワールド: 『ザ・シムズ4』で多くの人が物足りなさを感じていた点が、本作では十分に満足できる仕上がりとなっています。オープンワールドは概ねスムーズに動作し、素晴らしいデザインとなっている。建築モード:ライフシミュレーションの重要な柱の一つであるこの機能は直感的に操作でき、自由に配置できることでクリエイティブな人々にとって多くの可能性を広げている。日常生活におけるロールプレイング要素:パラは一日を通して決断を下し、日々新しい目標を追求します。 Steamユーザーsimka3002は次のように述べています 「これまで建築モードしかプレイしていませんが、たとえゲームプレイがイマイチだったとしても、建築モードだけでも購入する価値はありました!」Steamユーザーanniemaeherringは次のように書いています: 「2人の子供、5回の引っ越し、そして7年間の待ち時間を経て、Paralivesは間違いなく待つ価値があった。このゲームからは、ライフシミュレーションを心から愛する人々が開発したことが伝わってくる。細部へのこだわり、個性、自由度、そしてその魅力は、まさに信じられないほどだ。居心地の良い家の建設から、ささやかでありながら実にリアルに感じられる日常のひとときまで――開発者たちがこのゲームに全精力を注ぎ込んだことが伝わってきます!«レビューはこちら:バランス:スキルの習得が早すぎる、あるいは不自然だと感じる人もいる。バグ:表示エラーなどの小さなバグが頻繁に発生する。ごく一部からは、キャラクターエディタ、建築モード、またはジョブウィンドウに影響する重大な不具合の報告もある。コンテンツ不足:一部のプレイヤーは、ゲーム内の選択肢が限られていると感じています。特にライブモードでは、ゲームプレイがまだ簡素すぎると指摘されています。 SteamユーザーApokryphは次のように述べています: 「いくつかの要素のバランス調整が必要だと思います。例えば、睡眠中にランダムなスキルを習得できる機能などです。面白いアイデアですが、一夜にしてあらゆる分野のエキスパートになってしまうような気がします」。Steamユーザーlunogiは次のように書いています:「街に入るとすぐに問題が始まります。 自分のキャラクターや周囲の人々は非常に目的意識が薄く、プレイヤーの介入がなければほとんど何もしない。ゲームプレイはかなり活気がない。」ほとんどのプレイヤーは、Paralivesのようなライフシミュレーションゲームがアーリーアクセス段階にあることが何を意味するか理解している。些細なバグや、QOL機能の不足、改善の余地があるメカニクスは、ここではそれほど大きな問題とはなっていない。全体として、コミュニティは『Paralives』に大きな可能性を見出しているが、まだ長い道のりが残されている。私たちもこのライフシミュレーションを徹底的に検証した。上記にエレナによるレビューがある。