18.4 C
Berlin
木曜日, 7月 31, 2025

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

アサシン クリード シャドウズが新パッチ1.07で「ニューゲーム+」モードを実装

本日のパッチでゲームに新たな風が吹きます:アップデート1.0.7が配信され、多くの改善が施されました。PS5版は約9GBですが、PCやXboxではファイルサイズが大幅に大きくなっています。ユービーアイソフトは、コミュニティから多く寄せられた要望に応えてこのアップデートを実施しました。数多くのバグの修正に加え、開発チームはゲームプレイを大幅に拡張しました。 新しい才能、より多くの可能性: New Game+ モードでは、Shadow を再スタートすることが可能になり、装備、仲間、隠れ家など、これまでの進行状況がすべて引き継がれます。プレイヤーは最大 8 回まで挑戦することができ、ノルディックランごとに新しいチャレンジとより強力な敵が登場します。これにより、ゲームは新たなゲームループ段階に入ります。 数字以上のもの: 最大レベルが 60 から 80 に、ナレッジランクがレベル 9 & 10 に拡張され、鍛冶屋アップグレードレベル 4 がアンロックされました。 さらに、レベル 80、知識ランク 10、および NG+ でのみアンロックされる黄金の刀の 3...

Steamでたった5ユーロ:新作ホラーゲームが、私にとって過去数年で最も恐ろしい瞬間を提供しています

Steamで配信された新作インディーズホラーゲームが、数年ぶりに最も不気味な鳥肌モノの瞬間を提供しています – しかもたった5ユーロで。 Steamのホラーゲームジャンルは、今ではすべてが似通ってきているように感じます:同じような定番の展開、安っぽいジャンプスケア、廃屋、暗い廊下、ちらつく懐中電灯。Exit 8やBackroomsシリーズのような革新的なヒット作が登場しても、そのゲームシステムはすぐに数十の模倣作が生まれるのです。 インディーズのホラーゲームを定期的にプレイしている私としては、期待はそれほど高くない。しかし、Dread Flatsが登場した。そして、Voices of the Voidをプレイして以来、失っていた感覚が突然戻ってきた。それは、真の不安、真の緊張感だった。 そして、その瞬間は私の心に深く刻み込まれた。大きなジャンプスケアや血の噴出ではなく、静かに、そして直接心に突き刺さるような心理的恐怖だった。そして、そのすべてがわずか 5 ユーロで体験できるのだ。 忘れることのできないシーン これは何? Dread Flats は、ファンの依頼を受けて、中国にある謎めいた高層ビルを調査するビデオブロガーの役割を演じます。その理由は、彼に近い人物がそこで行方不明になり、警察も手も足も出せない状況だからです。カメラと懐中電灯を武器に、コンクリートでできた悪夢のような建物に足を踏み入れるしかないのです。 その後、探索、パズル要素、ストーリーの断片が徐々に組み合わさって、不穏な全体像が浮かび上がってきます。このゲームでは、よくあるジャンプスケアのような安っぽい演出はほとんどありません。Dread Flats の恐怖は、徐々に忍び寄ってきます。そして、まさにそれがこのゲームの魅力です。 ネタバレ注意! Dread Flats の特に印象的な重要なシーンについて、詳しく説明します。このゲームを偏見なく体験したい方は、この先を読まないことをお勧めします。 何日も後にまで鳥肌が立ったその瞬間は、比較的平凡な場面から始まります。 主人公は、夜間に何が起こっているのか、家の中で不気味な音がどこから聞こえているのかを確認するために、寝室に監視カメラを設置します。 最初は、すべては静かです。カメラの静かな音だけが聞こえます。しかし、その瞬間、それは起こりました。ワードローブがきしむ音を立てて開き、やせ細った老婦人が現れ、カメラを床に投げつけました。視界は狭くなり、映像は傾きましたが、ゲームは続きます。 その後、純粋な心理的恐怖が襲います。老女はただ立ち尽くしています。ベッドのすぐそばで。何分間も、眠る主人公を見下ろしたまま、動かないでいます。音楽も効果音もありません。ただ、不気味な沈黙が続きます。そしてついに、彼女はゆっくりとベッドの下に這い込み、そこに留まります。 自分が再びコントロールを取り戻した瞬間、プレイヤーキャラクターの真下に何かが潜んでいるという想像は、不穏であると同時に天才的です。 このゲームは、ある映画を思い出させました: デヴィッド・リンチ監督の『ロスト・ハイウェイ』です。この映画は、ある夫婦が謎のビデオカセットを受け取る場面から始まります。そのカセットには、彼らの家の中が、一人称視点で撮影された映像が収録されています。最初は家の外から、次に家の中、そして最終的には寝室で眠っている夫婦の映像まで映し出されます。誰が撮影したのか、その正体不明の人物がどのように家に入ったのか、誰もわからない。 ただし、次のことも言っておかなければなりません。 ゲームの残りの部分は、このレベルを完全に維持しているとは言えません。素晴らしいカメラワークのシーンの後、ゲームはより古典的な展開に進みます。不気味なおばあちゃんから隠れ、建物の中を忍び歩き、逃げ道を探します。 すべてがしっかり作られてはいますが、他のインディーズホラーゲームで見たことのあるものばかりです。テンポは速くなりますが、心理的な恐怖は残念ながら具体的な敵の存在に取って代わられてしまいます。 しかし、後半は前半に及ばないものの、ゲームは最後に再び盛り上がる。フィナーレでは、最後の巧妙なショックシーンが待ち受けており、少なくとも私は満足のいく恐怖感でゲームを終えることができた。もちろん、そこで何が起こるかは明かさない。 そして、Dread Flatsは1時間ほどでクリアできるため、コンパクトながらも非常に効果的なホラー体験をしたという感覚が残ります。たった5ユーロで、近年で最も激しい恐怖の瞬間の一つを手に入れられます。

ディアブロとパスのオブエクソダスに次ぐ最大のアクションRPGが新たなオーナーを獲得:パブリッシャーは現在スキャンダルに巻き込まれている

クラフトンは現在、元サブノーティカ開発者たちと対立している。このパブリッシャーは、アクションRPG『ラストエポック』の開発チームを買収した。 デジタル配信プラットフォームの普及により、現在では数多くの独立系ゲーム開発者が存在しますが、特に大規模なタイトルは、複数のスタジオを傘下に抱えるパブリッシャーが所有するケースがほとんどです。 大ヒットアクションロールプレイングゲーム「ラストエポック」とその開発スタジオであるエレベンスアワーゲームズも、不運なタイミングでインディーズの地位を失うことになった。 スキャンダルに巻き込まれたパブリッシャー 7月25日、Last Epoch のゲームディレクターがフォーラムの投稿で明らかにしたように、Eleventh Hour Games は、PUBG で知られる韓国のパブリッシャー、Krafton の一員となる。Krafton は、ライフシミュレーションゲーム Inzoi やサバイバルゲーム Subnautica 2 の制作も手掛けている。 しかし、後者に関しては、Krafton は、数週間にわたって話題になっている、メディアの注目を集めるスキャンダルに巻き込まれています。 このパブリッシャーは、職務を怠ったとして、スタジオの主要開発者を最近解雇しました。一方、解雇された開発者たちは、クラフトンが『サブノーティカ』のスタジオであるアンノウン・ワールドズとその創設者たちに支払われるべき2億5000万ドルのボーナスを支払わないために、このような措置を講じたと主張しています。 現在、元開発者たちはクラフトンを提訴し、サブノーティカ2の開発を妨害したとして出版社を非難しています。この紛争の最終的な解決と、双方の主張を裏付ける明確な証拠はまだ出ていません。 パブリッシャーと開発者の間の紛争は、一部のファンにも「ラストエポック」でも同様の問題が発生するのではないかという懸念を引き起こしています。そのため、アクションRPGのゲームディレクターもコメントを発表し、これらの懸念を和らげるよう努めています。 フォーラムの投稿で、彼はファンの質問に次のように回答しています: Unknown Worlds の状況については承知しています。直接コメントは差し控えさせていただきますが、状況をより深く理解した結果、このパートナーシップ締結に懸念は抱いていません。この件に関しては、多くの誤った情報や、一部の情報しか持たない関係者による発言があります。しかし、皆様が当社のことを心配してくださっていることを嬉しく思います。開発者はさらに、Kraftonが彼らの仕事に干渉したり、スタジオの運営を変更するつもりはないと強調しています。パブリッシャーによる買収は、Eleventh Hour Gamesの未来にとって良いことだと述べています。しかし、ファンがこの言葉で安心するかどうかは疑問です。多くのファンは、パブリッシャーに対して良い印象を持っていないようで、これはSubnauticaのスキャンダルとも関係しています。