-0.9 C
Berlin
金曜日, 3月 27, 2026

イーロン・マスクは「世界で最も賢いAI」を発表したが、そんなに単純な話ではない

Follow US

80ファンいいね
908フォロワーフォロー
57フォロワーフォロー

Grok 3はまもなくリリースされる予定だが、マスクが我々に信じ込ませようとしているほど圧倒的なものではないだろう。

より小型でより大型のAIが日々発表され、それぞれがさまざまな分野で他を凌駕しようとしている。しかし、これは特定のベンチマークやプログラミングのようなより複雑なタスクにおいてのみ起こる場合が多い。ヤン氏によると、これは一般ユーザーにとってはほとんど違いがないという。

しかし、イーロン・マスクは、自身のAI企業xAIの新しい大言語モデル(LLM)であるGrok 3を、世界で最も賢いAIと表現しています。。しかし、この主張の裏付けとなるものは何でしょうか?

イーロン・マスクは世界で最も裕福な人物の一人と考えられていますが、同時に最も物議を醸す人物でもあります。とりわけ、彼はユダヤ人投資家ジョージ・ソロスが hates humanity(彼は人類を憎んでいる)と呼ばれ、Soros(ジョージ・ソロス)に関する陰謀論が唱えられ、free speech(言論の自由)に対する彼の姿勢についての議論も行われた。

ムスクがTwitter(現X)を買収して以来、ヘイトスピーチ、フェイクニュース、政治的影響力に対するプラットフォームの対応について、増加する苦情が寄せられている。 最近では、マスクがX上でヨーロッパの各国首脳を個人的に攻撃し、はドイツの連邦選挙キャンペーンに積極的に干渉している。米国政治においては、彼はトランプ大統領のアドバイザーとみなされており、新大統領の下で新たに創設されたプロセス最適化のための役職に就いていると言われている。2025年1月のトランプ大統領の就任式の後、ムスク氏は公の場でナチス式敬礼と広く解釈されるジェスチャーをした。

また、最近ではドイツの政治に繰り返し干渉している。例えば、ドイツの新聞『ヴェルト』に極めて批判的に受け止められた記事を寄稿し、AfDを支持したり、X上でライブ配信を行うAfDの首相候補アリス・ヴァイデルにプラットフォームを提供したりするなど、複数の虚偽の主張を行っています。

Grok 3: 内部構造

MuskとxAIのデベロッパー数名が、X上でライブストリームでGrok 3を発表しました。ミニバージョンと特別な推論モデルもありました。

マスク氏によると、AIは恐ろしいほど賢い、つまり、恐ろしいほど賢いはずです。したがって、Grok 3はChatGPT-4oよりも論理的結論が優れ、より高い計算能力と適応性を持つと言われています。

つまり、このモデルはより高速に計算し、複雑な関係性をより正確に理解し、さまざまな質問に対してさらに柔軟に対応できるということです。

xAIによると、Grok 3は以下の機能を備えています。

  • AIは、コロッサス・スーパーコンピューター(Nvidia H100 GPU 100,000台)で訓練されたとされる。
  • 訓練には2億GPU時間(Grok 2の10倍)が費やされたと言われている。
  • モデルは人工的に生成されたデータで訓練されました。この合成データは、多様かつ管理されたデータセットを確保し、プライバシーに関する懸念を軽減するように設計されています。
  • 開発者は、強化学習と強制学習という機械学習手法を使用しました。これは、モデルが報酬関数に基づいて出力を評価し、改善する手法です。
    また、人間によるフィードバックを用いた強化学習(RLHF) も適用されました。ここでは、実際の人間がアウトプットを評価し、報酬関数を改良し、AIコンテンツの品質をさらに向上させます。
  • 文脈に応じたトレーニングは、AIが文脈をより理解し、それに適応した回答ができるように設計されています。
  • LLMは、回答を分析し、事実と比較することで、自ら修正できるはずです。
  • DeepSearchは、高度な研究および言語機能であり、後で追加される予定です。

大きな目標: 幻覚を減らし、論理的な正確性を高める。

幻覚とは何でしょうか?LLMにおける幻覚とは、誤った情報またはでっちあげの情報です。これは、一般的なチャットボットの弱点として知られており、AIが生成した回答を常に疑うべき主な理由でもあります。

Grok 3はいつ登場するのでしょうか?米国では、一部のユーザーはすでにGrok 3を使用できるはずです。まずは有料購読者(月額40ドル)が対象となります。ただし、正確なスケジュールは不明です。

EUおよび英国では、xAIがEU規制に準拠するための調整を行っているため、Grok 3は当面の間利用できません。

Grok 3:世界で最も賢いAI?

Grok 3 が他の LLM よりも優れているのはどのような点でしょうか? xAI がライブストリームで示したベンチマークによると、Grok 3 は数学、プログラミング、科学的な質問などの論理的タスクにおいて特に競合他社よりも優れています。

しかし、xAI は他の分野のベンチマークの提示は控えました。これについては後ほど詳しく説明します。

Grok 3 がより少ない幻覚を生み出すと想定されているとしても、この目標がすでに達成されているというわけではありません。OpenAI は、自己修正、合成データ、および人間からのフィードバックによる強化学習(RLHF)にも依存しています。

AIが実際にどれほど優秀なのかは、独立したユーザーがテストしてみないとわからない。

ライブストリームでの疑わしい発言

マスク氏と彼のチームによるいくつかの発言は、誤解を招く、または誤解を招く可能性がある。だからこそ、ここでそれらを取り上げたい。

ムスク氏はライブストリームで、Grok 3は究極の真実追求AIであると主張しました。しかし、これは時に政治的に正しいとされる内容と矛盾するものです。 彼がほかの開発者が意図的に事実を誇張しているとほのめかしているのか、あるいは事実や背景を積極的に異なる形で提示しようとしているのか、あるいは純粋に政治的な挑発行為なのか、判断するのは難しい。

AIは日々進化している: ムスク氏は、モデルは日々改善されていると主張している。 それが些細な調整を意味するなら、それでも構わない。 しかし、LLMのトレーニングは最終的に公開前に終了し、その後は些細な調整のみが行われることを明確にしておきたい。

驚くべき開発時間: マスク氏は、xAIの開発が2023年に開始されたばかりであるのに対し、他の企業は2019年からLLMに取り組んできたと強調しました。 しかし、真の飛躍は開発時間ではなく、膨大なデータと演算能力にあることを彼は言及しませんでした。したがって、資金力のある企業であれば、独自のAIモデルを迅速に開発するのは比較的容易である。

ベンチマークは3つの分野のみ: Grok 3が言語処理などの他の分野でどの程度優れた性能を発揮するかは、依然として不明である。なぜなら、マスク氏と彼のチームは論理処理のベンチマークのみを示しているからだ。

世界で最も賢いAIという呼称は、検証可能な事実というよりもマーケティング的なものである。少なくとも、マスク氏と彼のチームは、この最高評価を正当化するような画期的な革新性を示していない。

現在、Grok 3がトップに立っているとしても、OpenAI、Google、Anthropicの各社が開発中の新モデルは、すでに存在している。

世界政府サミット(2月11日~13日)で、マスク氏は、他のAIがGrokよりも優れているのは今回が最後になる可能性があると述べた。これはまだわからない。

RELATED ARTICLES

ソニー、PlayStation Storeから一挙に700本のゲームを一蹴 メーカーは闘志満々

今年2度目となる、ソニーがショベルゲームを一斉にキャンセル</p先日、PlayStation Storeから約700本のゲームが剥奪された。今はおそらく心配する必要がないのは、影響を受けたゲームの種類、いわゆるショベルゲームのためだ。タイトルはパブリッシャーのNostra GamesとCGI Labのもので、キャンセルされたゲームの大半はNostraのものです。ショベルゲーム (ショベルウェアとも呼ばれる) とは何ですかこれらのゲームは、少しの努力で、しばしばAIを使用して制作され、複製されたものです。This mass of usually not particularly high-quality games is then published in digital stores...

不明確な『サンド』の発売日、ファンの間で憶測呼ぶ

Steamでは2026年3月発売予定とされているものの、PvPvE抽出シューター『Sand: Raiders of Sophie』の発売日は依然として不明だ。月が終わりに近づくにつれ、具体的な発表を待つファンの間で不安が高まっている。コミュニティにおける不確実性ゲームのDiscordコミュニティでは、ゲームが3月にもリリースされるのかという疑問が山積みになっている。サンド』の開発スタジオであるtinyBuildのコミュニティ・マネージャーは、プレイヤーに最新情報を伝えようと努力している。「具体的な日付はまだ言えませんが、最新情報を提供し続けることを約束します」と、Discord マネージャーの Jacky は言います。重要な要素としての開発段階。シニアコミュニティマネージャーのTinyJay氏は、最終的な発表は開発作業の最終段階にかかっていると説明します。「具体的な情報を共有する前に、開発側でまだ整理しなければならないことがたくさんあります」とTinyJay氏。開発者たちは、守れないかもしれない期限を教えたくないようだ。ファンの忍耐は緊張している。不透明な状況に苛立ちを覚えるが、開発者たちはコミュニティを見捨てているわけではないと断言している。ファンは忍耐強く、すぐにリリース日が明確になることを願っている。よくある質問</h2『サンド ソフィーの冒険』の発売日はいつですか?正確な発売日はまだ発表されていませんが、大まかな時期として2026年3月が挙げられています。なぜ発表が遅れているのですか?遅れが生じているのは、正式な日付を発表する前に最終的な開発作業を行う必要があるためです。tinyBuildはコミュニティにどのように情報を提供していますか?tinyBuildは主にDiscordプラットフォームを使って、プロジェクトの状況をコミュニティに知らせ、質問に答えています。

RedditのCEO、ボットに鎖をつけ 「不審なアカウント 」に新たな認証を導入へ

Redditは新しい認証レベルを導入し、疑わしいアカウントの背後に実際に人間がいることを証明できるようにしようとしています。Redditは何年もの間、スパムやボット軍団と戦ってきた。詳細な記事の中で、RedditのCEOであるスティーブ・ハフマンは、このプラットフォームが今後どのようにこの問題に取り組んでいきたいかを説明している。核となるメッセージは、一見すると奇妙に読める:人間もボットと同じように歓迎される - しかし後者は、明らかにそれとわかる場合にのみ歓迎される。人間のふりをしてディスカッションを操作するアカウントは、その行為から逃れることが難しくなるはずだ。この目的のために、Redditは従来のキャプチャを超える新しい認証レベルを計画しています。Huffmanによると、「疑わしいアカウント」、つまり自動化されたネットワークや調整されたネットワークに似ているアカウントは、特に影響を受けるという。 レディットはどのように新しい認証レベルをフィルターしようとしているのか?どのようにRedditは疑わしいアカウントをフィルタリングしたいのか。Reddit CEO はまだ漠然としていますが、少なくとも基本的な原則の概要は次のとおりです:内部システムがアカウントの振る舞いを評価し、ボットのように振る舞う可能性が高いものをマークする。div class="iframely-embed"div class="iframely-responsive" style="padding-bottom: 52.1429%; padding-top: 120px;"a href="https://www.reddit.com/user/spez/comments/1s3ezrc/humans_welcome_bots_must_wear_name_tags/? utm_source=share&utm_medium=web3x&utm_name=web3xcss&utm_term=1&utm_content=share_button&seeker-session=true「 data-iframely-url=」https://iframely. net/k2eJ6h2X?theme=dark"/a/div/divscript async src="https://iframely.net/embed.js"/scriptこの兆候には、投稿が作成され公開される割合が高いこと、時には多くのサブレディットで同じものが公開されること、あるいは「調整されたアップボートパターン」などが含まれます。これらのアカウントは、今後さらにチェックを受けることになっている。</p.ハフマン氏は詳細を明らかにせず、「ボットにとっては難しく、人間にとっては簡単」であるべき手続きについて、一般的な言葉で語っている。The Verge...