13.8 C
Berlin
土曜日, 6月 13, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

新作『トゥームレイダー:レガシー・オブ・アトランティス』をプレイして、今や有頂天だ

『トゥームレイダー:レガシー・オブ・アトランティス』はシリーズ第1作のリメイクではあるが、我々のゲームプレイレビューの結論はこうだ。この作品は、何よりもまず未来を指し示しているのだ。さて、文句を言う人がいるでしょうか。長年にわたり、新しい『トゥームレイダー』のゲームは、ドイツの大都市での適正な家賃よりも希少でしたが、今や新作が1本だけでなく、なんと2本も登場します!『トゥームレイダー:カタリスト』は、最新の再起動トリロジーだけでなく、それ以前の3つの『レジェンド』シリーズも、ある意味で首尾一貫して継承しようとする、壮大な続編です。そしてもう一つ、『トゥームレイダー:レガシー・オブ・アトランティス』がある。2027年に発売予定のこの『トゥームレイダー』は、クリスタル・ダイナミクスとフライング・ワイルド・ホッグ(『イービル・ウェスト』、『シャドウ・ウォリアー』)によって開発されており、崇高な使命を帯びている。1996年という年が、映画館でスマホをずっと見ずに過ごすことよりもさらに「太古の昔」に聞こえる若い世代のために、ララ・クロフトの起源、つまりシリーズ最初の作品を再リリースすることだ。ただ、一つだけ問題がある。ララ・クロフトは長年にわたり変化してきた。最近のシリーズ作品では、彼女のセリフが時折Tumblrの投稿のように聞こえることもあるが、当時のララはクールさという点で、どんな氷の塊よりも圧倒的な存在感を放っていた。では、『レガシー・オブ・アトランティス』のヒロインは、リブート時代の新たなスタイルに合わせるために、その輝きを失わなければならないのだろうか?2026年のサマー・ゲーム・フェストで『トゥームレイダー:レガシー・オブ・アトランティス』を試遊した結果、私は断言できる。いいえ。一味違うリメイク人生経験豊富な皆さんなら、すでに気づいていることでしょう。かつて『トゥームレイダー』初代のリメイクはなかったでしょうか?その通りですが、『Legacy of Atlantis』は2007年の『トゥームレイダー:アニバーサリー』とは全く異なる方向性を打ち出しています。『メタルギアソリッド デルタ』や、近日発売予定の『アサシン クリード:ブラックフラッグ リシンクド』のような、原作に忠実なリメイク作品とは異なります。『レガシー・オブ・アトランティス』は1996年のオリジナル『トゥームレイダー』を基にしていますが、原作をあくまで「色見本」として扱い、そこから全く新しい芸術作品を生み出そうとしています。30分間の試遊セッションで、ペルーステージをプレイした際、そのことを実感しました。『Legacy of Atlantis』の冒頭シーンは、オリジナル作品を知るファンにはお馴染みの展開だ。タフな考古学者ララ・クロフトは、伝説のアトランティスの遺物を回収するため、企業トップのジャクリーン・ナトラにスカウトされる。その遺物のひとつは、アンデス山脈のインカ遺跡ヴィルカバンバに隠されているとされ、ゲームは早速ペルーから始まる。デモ全体を通して、ララはクラシックな『トゥームレイダー』時代の魅力を存分に放っている。アリックス・ウィルトン・リーガンによる見事なイギリス訛りで語られる皮肉なセリフを口にし、誰にも指図されることを許さないが、決して馬鹿っぽくも、逆に無関心すぎることもない。少なくともこのデモにおいては、開発者たちは完璧なバランスを見事に捉えている。「私が今まで見た中で最も美しいゲームの一つ」新しいペルーステージは、オリジナル版といくつかの大まかなコンセプトを共有している。ララは古い柱や水路システムを操作して道を開き、最後にはティラノサウルスが待ち構えている。しかし、その「やり方」はまったく新しいもののように感じられる。『トゥームレイダー1』(および『アニバーサリー』)のステージは、ペルーやギリシャ、エジプトの装飾を施した体育館のような印象で、箱や出っ張り、部屋があまり自然には感じられなかったが、『レガシー・オブ・アトランティス』では、すべてが唯一無二に見える息をのむような風景が待ち受けている。あえて断言しよう。『レガシー・オブ・アトランティス』は、私が今まで見た中で最も美しいゲームの一つだ。もちろん、前作の『Shadow of the Tomb Raider』もグラフィックの力を存分に発揮していましたが、『Atlantis』はUnreal Engine 5から、他に類を見ないほどの豪華さを引き出しています。ペルーの遺跡は植物に覆われ、岩のひび割れひとつひとつがリアルに表現されています。組み立て式感が大幅に軽減その結果、ゲームプレイも組み立て式のような印象が大幅に薄れています。確かに、ララ・クロフトの武器や装備の核となる部分は非常に馴染み深く、『シャドウ オブ ザ トゥームレイダー』のデザインの特徴がほぼそのまま引き継がれています: 登ったり、謎を解いたり、時折戦ったりしなければならない。しかし、『アトランティス』はオリジナルよりもはるかに滑らかな流れを実現している。なぜなら、同じ操作を2回続けて行うことがほとんどないからだ。例えば、ある仕掛けを起動するには歯車を集めなければならない。最初の歯車は、グラップリングフックで木の梁を引きちぎり、その奥にあるアイテムを露出させることで、かなり簡単に手に入れることができる。2つ目は、古代の水車を操作する必要があります。そして3つ目は、巨大な滝を登り、つるはしで茂みを切り開き、即席の横木にぶら下がって断崖を越え、その後、純粋な体力を駆使して仕掛けを破壊し、歯車が滝を流れ落ちるようにします。ちなみに、新しいスキルシステムも導入されています。秘密を見つけるとスキルポイントを獲得でき、それを使って……何かをアンロックできるようになります。デモ版ではこの機能はまだ無効になっていましたが、おそらくクラフトや体力強化に関するものだと思います。クラフトについて言えば、リブートシリーズと同様に、ララは周囲で様々な植物や資源を見つけ、それらを使って便利な……アイテムを作り出すことができます。ここでも、デモ版ではHP回復アイテム以外は非常に控えめな内容となっています。そして3つ目の「漠然とした」点:オプションでは、パズルを含むあらゆる難易度を手動で調整できます。しかし、それが具体的にどのような影響を与えるかは、まだ分かりません。説明文によると、高難易度では表示されないヒントやUI上のアドバイスなどが主な要素のようです。つまり、開発チームは多くの真に新しいメカニクスをまだ隠しており、この体験版はあくまで大まかな第一印象にとどまっているということです。「隠している」と言えば、デモの最後になってようやく戦闘が始まります。これは素晴らしいと思います。正しい焦点長年にわたり、『トゥームレイダー』は、アクションアドベンチャーというよりはアクションシューティングであるかのように振る舞うことが度々ありました。2000年代には『コール オブ...

『エルダー・スクロールズ6』から、ついに公式な動きが再び――最初のティーザーから8年を経て

『エルダー・スクロールズ』ファンほど、これほど長い忍耐を強いられている人々はほとんどいないだろう。シリーズの次回作には、いまだに発売日が決まっておらず、本格的なトレーラーなどなおさらだ。しかし、ようやくわずかながらも動きが見られた。ベセスダは今年、いくつかの記念すべき年を迎えている。40年前にベセスダ・ソフトワークスが設立され、まもなく15年前に『スカイリム』が発売された。そして、もう一つ、あまり愉快ではない日付がある。ちょうど8年前の2018年6月11日、『The Elder Scrolls 6』の最初のティーザー映像が公開された。その後……何も起こらなかった。それ以来、ベセスダが『スカイリム』の後継作について言及した回数は、片手で数えられるほどだ。新しいトレーラーも、具体的な情報も、ましてや発売日も、今日に至るまで一切ありません。『The Elder Scrolls 6』は、もし公式に発表されていなければ、もうすぐ『Half-Life 3』のような伝説的な存在になっていたことでしょう。しかし、8周年の記念として、せめてもの小さな生存の兆しはあります。『The Elder Scrolls 6』はまだ存在する今年のサマー・ゲーム・フェストを前に、ファンたちは再び『The Elder Scrolls 6』の発表を期待していたが、その期待は裏切られた。あるインタビューでVarietyはそこで、Xboxの責任者であるマット・ブーティに、ファンの期待にどう対応しているかを尋ねた。ブーティは次のように答えている:私のような仕事における最大の課題の一つは、現在取り組んでいるクールなものをすべて世界に披露したいという欲求と、早い段階で人々をワクワクさせたいという欲求とのバランスを取ることだと思います。しかし、私たちは適切なタイミングを待つべきだとも理解しています。そして、公開を決断した時には、それが自分たちが提供できる最高のものであるべきです。ゲームを公開するということは、同時に人々に『まもなく登場しますよ』という約束をすることでもあります。ですから、こうお伝えできます。私はベセスダを訪れ、トッド[ハワード]と顔を合わせ、『エルダー・スクロールズ』がプレイされる様子を見ました。その出来栄えは素晴らしく、開発も順調に進んでいます。そして、私たちは適切なタイミングで発表し、正式に公開できるよう確実に進めていきます。はぁ。つまり、今回もまた新しい情報は得られなかったわけだ。ブーティが実際に明かしたのは、『The Elder Scrolls 6』の開発が順調に進んでいるということだけだ。とはいえ、Xboxの幹部がカメラの前でそれ以外のことを口にするはずもないだろう。少なくとも、Xboxのトップはトッド・ハワードと同様の考えを持っており、発表から発売までの期間をあまり長くしたくはないようだ。つまり、『The Elder Scrolls...

『Path of Exile 2』:ついにキャンペーン以外の選択肢が登場か?開発元本人に直接聞いてみた

多くの『Path of Exile 2』プレイヤーは、ついにキャンペーン以外の選択肢を求めている。そこでGrinding Gear Gamesに、ストーリーをスキップする機能の導入予定があるかどうかを尋ねてみた。多くのプレイヤーにとって、『Path of Exile 2』の魅力は、キャンペーン終了後の展開、すなわちアトラス、刷新されたエンドゲームの仕組み、ビルドの完成度を高める過程にあるのではないでしょうか。だからこそ、ある点が繰り返し批判の対象となっています:新しいキャラクターでプレイするたびに、毎回ストーリーをやり直さなければならないのです。私たちはGrinding Gear Gamesに、エンドゲームへの代替レベル上げルートが計画されているかどうかを尋ねました。その回答は極めて明確なものでした。コミュニティは近道を望んでいる『Path of Exile 2』に関する前回の記事では、概ね好意的な反応が見られましたが、コメント欄ではある批判が繰り返し挙がっていました。それは、キャンペーンの長さと強制性についてです。特に家庭や仕事の事情を抱えるプレイヤーにとって、エンドゲームに至る道のりはしばしば忍耐の試練となります。以下は、コメント欄から寄せられた声の一部です:marcel110891はこのゲームが大好きですが、フルタイムの仕事を持つ父親として、キャンペーンの長さは単に苛立たしいだけだと述べています。彼は、ストーリーを短縮して、エンドゲームコンテンツで直接レベル上げができるようになる方法を待ち望んでいます。Pantheもこれに全面的に同意しています。180時間プレイしても、新しいクラスを試すのが好きなので、エンドゲームに到達したのはたった1回だけだった。少なくともサブキャラに関しては、スキップ機能があればありがたい。Extrawurstは、ストーリーをすでに15回以上クリアしており、もう見たくもないほどだ。今では以前より早く進められるようになったとはいえ、依然として退屈な義務的な作業だ。El Cativoはこれに異議を唱える。キャンペーンのプレイ時間は約16時間なので、時間がなくても数晩で十分クリアできるという。ゲームディレクターのコメント皆様からの懸念を開発チームに伝え、Path of Exile 2のゲームディレクターであるジョナサン・ロジャース氏から明確な回答を得ました。『Diablo 4』のように、純粋な「グラインド」だけでレベルアップできることを期待していた方は、残念ながら覚悟が必要になりそうです。ジョナサン・ロジャース氏は、皆さんの批判について次のように説明してくれました:...