よへラボブログ | Grok次期モデルはV9か——「Cursorデータ追加」でxAIがコーディングAI戦争に踏み込む理由

Grokまわりで、また大きめの話が出ています。

ただ、今回は少し慎重に見た方がいいです。xAIの公式Docsで確認できる話と、Elon Musk本人のX投稿ベースの話と、そこから先の予想が混ざりやすいからです。

なのでこの記事では、先に線を引きます。現時点で公式に確認できるGrokの現在地、X投稿ベースで見えてきたV9-Medium、そしてその先のGrok 5への見立てを分けて整理します。

結論：次の本命はV9-Medium。ただし、見るべきは「1.5T」だけじゃない

いちばん食いつきやすい数字は、たぶん「1.5T」です。現在の本番モデルとして投稿内で触れられた0.5Tのv8-smallから、V9-Mediumは約3倍の規模になる、という話です。

でも、僕が本当に大きいと思うのはそこだけではありません。むしろ重要なのは、Cursorデータが補足訓練に入ったと説明されている点です。

AIコーディングの勝負は、ただコードをたくさん読ませれば勝てる、という段階から少し進んでいます。実際の開発では、プロンプト、周辺ファイル、エラー、修正の試行錯誤、最終的な着地までがつながっています。もしそこに近いデータが学習に使われているなら、Grokは「コードを書くAI」ではなく、作業の流れを読むAIに近づく可能性があります。

Grok次期モデル情報の確度を整理した表 — 確度マップ：公式Docs、Elon MuskのX投稿、予想を同じ温度で扱わないための整理。

いま公式に確認できるGrokの現在地

2026年5月25日時点で、xAIの公式DocsではGrok 4.3が主力モデルとして掲載されています。Docs上では、1,000,000トークンのコンテキスト、ツール呼び出し、構造化出力、設定可能な推論などが示されています。

また、xAIは5月にGrok Buildも出しています。これはターミナルから使うコーディング向けの流れで、公式のリリースノートでも早期アクセスやベータとして案内されています。つまり、xAIが最近かなり強く「開発者」「コーディング」「エージェント」に寄せているのは、公式情報から見ても自然です。

一方で、V9-Mediumという名前は、この記事を書いている時点では公式Docsのモデル一覧には載っていません。ここは大事です。だから、V9の話は「xAI公式ページで一般公開されたモデル」という扱いではなく、Elon MuskのX投稿ベースの次期モデル情報として読むのが安全です。

Elon Muskの投稿で見えたV9-Medium

Elon MuskのX投稿ベースでは、Grokの次期基盤モデルとしてV9-Mediumが語られています。内容を整理すると、だいたい次のような話です。

Grok foundation model V9-Mediumは1.5T規模
訓練は完了し、評価は良好と説明
補足訓練にCursorデータがかなり入った
fine-tuning中で、数日以内にreinforcement learningが始まる見込み
公開リリースは2〜3週間後という見立て
難しいコーディングタスクで、現行の0.5T v8-smallより大きく改善するという説明

ここで注意したいのは、これは本人投稿としては強い情報だけど、まだ製品ページやDocsに落ちてきた正式仕様ではない、という点です。

ただ、完全な噂だけで終わる話でもありません。xAIの公式側でもGrok 4.3、Grok Build、Grokの外部開発ツール連携が動いています。そこへV9-Mediumの投稿が重なると、xAIがコーディングAI領域をかなり本気で取りに来ている、という流れは見えます。

Grok V8-small 0.5TとV9-Medium 1.5Tの規模比較グラフ — 規模比較：V9-Mediumは投稿ベースでは0.5Tから1.5Tへ約3倍。ただし性能は規模だけでは決まりません。

一番の焦点はCursorデータ

今回の話で、僕が一番見たいのはベンチマークの点数ではありません。Cursorデータを使ったことが、実際の作業感にどれだけ効くのかです。

AIコーディングで本当に困るのは、単発の関数生成ではなく、少し大きめの変更です。古いコードを読んで、影響範囲を見て、壊れそうなところを避けて、テストやエラーを見ながら直す。ここが弱いと、AIは便利だけど最後は人間が全部尻ぬぐいする感じになります。

もしV9がCursor由来の開発フローに近いデータから学んでいるなら、強くなる可能性があるのは次のあたりです。

複数ファイルをまたぐ修正
エラーから原因をたどるデバッグ
既存コードの癖に合わせた実装
途中で方針を変えながら進めるエージェント作業
ユーザーの曖昧な指示を、作業単位に分解する力

逆に言うと、ここが体感で伸びなければ、1.5Tという数字だけではそこまで驚きません。大きいモデルはすごい。でも、開発者が毎日使うAIで大事なのは「最後までやり切る安定感」です。

CursorデータがコーディングAIに効く理由を示すフロー図 — Cursorデータの意味：プロンプト、コード文脈、編集履歴、完了結果がつながると、単なるコード生成より作業エージェント向きになる。

Grok 5の話は、まだ強く断定しない方がいい

V9の先には、当然Grok 5の話も出てきます。巨大モデルになるとか、Colossusの計算資源でさらに大きな訓練が進むとか、いろいろな見方があります。

ただ、Grok 5については、この記事では断定しません。現時点で追いやすいのは、まずV9-Mediumが本当に2〜3週間で出るのか、出たとしてコーディングの体感がどれくらい変わるのか、というところです。

Grok 5を読むなら、パラメータ数の噂よりも、次の3つを見る方が現実的だと思います。

Grok Buildや外部ツール連携がどれだけ実用化するか
コーディング、検索、ファイル操作、実行環境がどこまで一体化するか
XやTesla、SpaceXを含むMusk系エコシステムの中で、Grokがどこまで深く使われるか

ここがつながると、Grokは単なるチャットAIではなくなります。文章を書くだけではなく、調べて、直して、動かして、確認するAIになります。xAIが本当に狙っているのは、たぶんそこです。

日本の開発者やビジネス層が見るべきポイント

日本でこの話が刺さる理由は、単に「ElonのAIがすごい」ではないと思います。

今、AIコーディングは個人開発者だけのものではなくなっています。社内ツール、問い合わせ対応、商品ページの改善、ログ解析、WordPress運用、簡単な業務自動化。こういう小さな仕事をAIに任せたい人が増えています。

そのときに必要なのは、きれいなサンプルコードを出すAIではありません。途中で詰まっても戻ってこられるAIです。環境を読んで、ミスを減らして、修正して、最後に使える形まで持っていくAIです。

V9-Mediumが本当に強くなるなら、Grokはこの領域で一気に存在感を上げる可能性があります。Claude、Codex、Gemini、Cursorのような開発者向けAIの競争に、xAIが正面から入ってくる形です。

気になるリスク：データの扱いは見続けたい

一方で、Cursorデータという言葉には、期待だけでなく慎重さも必要です。

どんなデータが、どの範囲で、どのように匿名化され、どのユーザーや企業の設定がどう反映されているのか。ここは外からは分かりにくい部分です。企業利用では特に重要になります。

僕は、V9が出たら性能だけでなく、データ利用の説明がどこまで出るかも見たいです。AIコーディングは仕事の中身に近い情報を扱うので、強さと透明性はセットで見た方がいいと思います。

まとめ：V9が来たら、Grokの評価はかなり変わるかもしれない

今回の話を一言でまとめるなら、Grokの次期モデルは「大きくなる」より「開発作業に寄ってくる」ことが重要です。

1.5Tという数字は派手です。2〜3週間というスピード感もxAIらしいです。でも本当の見どころは、Cursorデータを入れたことで、Grokがどれだけ実務のコーディングに強くなるかです。

もしV9-Mediumが、複雑な修正やエージェント作業で体感できるほど伸びていたら、Grokは「XについているAI」から、「開発者が選択肢に入れるAI」へかなり近づきます。

逆に、数字だけ大きくて作業の安定感が伸びなければ、話題性はあっても日常利用には残りにくいです。

だから、次に見るべきなのはベンチマークの勝ち負けだけではありません。実際に触ったときに、面倒な作業をどこまで任せられるかです。V9がそこを変えるなら、Grokの見方はかなり変わると思います。