9.9 C
Berlin
土曜日, 4月 4, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

もう少しで引っかかるところだった:2026年のゲーム・エイプリルフールのいたずら

4月1日といえばイタズラ。ゲームとエンターテインメントの世界から、最も意地悪なイタズラをまとめてみました。この記事を読んでいる時点で、あなたは気づいているはずだ: 今日は4月1日、つまり、たくさんのいたずらやいたずらに備える必要があるということだ。いたずらの日には、メディア界全体が私たちの目をごまかそうとする。私たちは、ゲームやエンターテイメントから最も信じられないニュースを詳しく見て、2026年からの最高のエイプリルフールのいたずらを紹介します。特に汚いデート・シミュレーター。4月1日、冗談のようなゲーム発表の半分はデート・シミュレーターのような気がする。奇抜な恋愛ゲームの代表として、Date the DirtPowerwash Simulatorの開発者によるものを紹介しよう。プレスリリース」にはこうある。 「デート・ザ・ダート」は完全に本物のゲームです。『Date the Dirt』は、『PowerWash Simulator』シリーズの開発者であるFuturLabによる、完全に正真正銘のスピンオフ作品です。エキセントリックな汚れ役のグループを彼らの汚い足元から集め、数多くの、詳細で、間違いなくすでにプログラムされたデートを過ごします。そして、ゲームはリリースされません。 予約注文へのリンクは...「World of Warcraft」のハードコアハウジング|WoW: Midnight『WoW: Midnight』では、ついにハウジング、つまりMMOにおける自分だけの4つの壁を楽しむことができます。今年のBlizzardのエイプリルフールのジョークとして、「極秘」プロダクションノートがフォーラムに掲載されましたキャラクター用の動物の尻尾など、奇妙なアップデートの数々が発表されています。また、「ハードコア・ハウジング」も新たに追加されました。住宅ローン、保険、維持費を支払うことを約束する実際の契約を結ぶ。期限内に支払うと、以下のような特典がある。毎月の支払いに一度だけの猶予期間 変動金利ローンを固定金利ローンに変更するためのクーポン券(有料) 住宅の耐火性が20%向上します。特別付属品:お気に入りの小さな装飾品を収納できる「Go Bag」。マインクラフトファンのためのAIガールフレンド。マインクラフトが好きな人なら誰でも、自分だけのブロックの世界に住めたらどんなだろうと想像したことがあるでしょう。ひとつ問題がある。Minecraft wikiは現在これを改善したいと考えており、「大手AI企業」とのコラボレーションを発表しています。https://www.global-esports.news/wp-content/uploads/2026/04/The-mascot-of-the-Minecraft.jpg「Minwi...

「存亡の危機」:Nvidia CEO、CUDAへの賭けがいかに会社を破滅させかけたか、そしてなぜそれに固執したかを語る

CUDAは、エヌビディアの株式市場価値を80%も急落させた「賭け」だった。 ジェンスン・フアン最高経営責任者(CEO)は、なぜそのようなことが起こったのか、そしてなぜその戦略に固執したのかについて説明しています。エヌビディアのジェンセン・フアンCEOは最近、ポッドキャストで自社の歴史について詳しく語った。特に、2006年に発表されたCUDAプラットフォームについて語られたが、Huang氏によれば、このプラットフォームがNvidiaを破滅させるところだったという。 は次のように述べた。その は、存続の脅威に最も近づいた最初の戦略的決定でした。20年以上前の最初の一歩。CUDAの技術的な基盤は、NvidiaがIEEE互換の32ビット浮動小数点演算(FP32としても知られる)をシェーダーユニットに組み込んだ2003年までさかのぼります。.これは、実際にはCPU用に設計された科学的コードが、原理的にはNvidia GPU上でも実行できることを意味した。研究者はすでにこれを利用する方法を知っていたので、CUDA(「Compute Unified Domain Architecture」)は、本格的なアーキテクチャのコンテキストにおける論理的なステップとして続きました。エヌビディアの株式市場価値を半減させた決断。しかし、この技術のアイデアは本当のドラマではなく、商業的な実装だった。黄は、CUDAを高価なワークステーションGPUだけでなく、すべてのGeforceカードに導入するという重大な決断を下した。Nvidiaの最も安価なゲーミングGPUでさえ、CUDAをサポートしている。純粋なPCゲーマーは、CUDAで何をするのかまったくわからなかったので、彼らの好きな趣味にとってむしろ重要でないアーキテクチャのためにプレミアムを支払うよう説得するのは困難でした。しかし、CUDAを実装するためにGPUの製造コストは上昇した。。CUDAによって当社のコストは約50%増加し、当時、当社は粗利益率約35%の会社でした。マージンはチップあたり約1.5ドル減少しました。株式市場への影響は残酷なものでした。CUDAの発売後、Nvidiaの時価総額は約80億ドルから15億ドル弱まで落ち込みましたが、これは今日の株式市場価値と比較すると、まさに馬鹿げた数字でした。「CUDAの賭け」は報われた。それでもNvidiaのCEOは、Geforceグラフィックスカードを通じてCUDAを顧客に提供することが不可欠だと考えていた: CUDA が新しいコンピューティング アーキテクチャとしてチャンスを得るには、できるだけ多くの人々の手に渡る必要がありました。Huangの目には、この戦略の背後にある原則がすぐに説明されています。[それ以外のことは二の次です」。流れが変わるには数年かかった。2012年、ニューラルネットワーク 「AlexNet 」は、ImageNetコンペティションですべての競合他社に10ポイント以上の差をつけた。基盤となるハードウェアは?CUDAを搭載したNvidiaのグラフィックカードで、突然、誰もがこのアーキテクチャについて話題にした。<hr背景:四半世紀前、ある学生が32枚のGeforceグラフィックカードを接続してQuake 3をプレイしていた。こうしてCUDAが誕生した 。<hr振り返ってみると、Huang 氏は、Nvidia の成功は Geforce...

中世から中つ国へ?噂によると、Warhorse社は『ロード・オブ・ザ・リング』のロールプレイングゲームを制作中らしい。

『Kingdom Come: Deliverance』のメーカーが、中つ国RPGの大作を作るという噂がある。この噂は以前からあったが、現在新たな盛り上がりを見せている。(この記事はエイプリルフールのジョークではありません。のどかなボヘミアからトールキンの壮大なファンタジー世界へ? チェコのKCD2開発スタジオWarhorseは、『ロード・オブ・ザ・リング』をベースにしたゲームに取り組んでいると何度か噂されてきました。Now there is another insider voice who wants to confirm this.これまでに判明していることを分類してみました。また、この記事はエイプリルフールのジョークではありません。噂:Warhorseは現在、中つ国に取り組んでいる。2025年末、Insider Gaming(ゲーム業界からの正確なリーク情報を繰り返し掲載し、明らかに人脈に恵まれている)は、中つ国の大型新作ゲームが制作中であると報じた。このゲームはアラブ首長国連邦から1億ドルの支援を受け、中つ国の権利を持つエンブレイサー・グループのスタジオによって開発される予定です。WarhorseはEmbracer傘下のスタジオの一つで、彼らは最新のKCD2でトップクラスのロールプレイングゲームを作れることを証明した。ずっと少ない予算で。だから、それは十二分に考えられるだろう。Insider Gamingが報じているように、ポーランドの業界ベテランであるRyszard Chojnowski氏がこの件についてコメントしています。彼は数週間前にこの噂を聞いたが、最初は信じなかった。 しかし、彼は現在、いくつかの情報源からこのような趣旨のささやきを耳にしています。しかし、全体的にかなり混乱しています- 驚くべきことではありません。というのも、他の情報源も、Crystal...