Grokまわりで、また大きめの話が出ています。
ただ、今回は少し慎重に見た方がいいです。xAIの公式Docsで確認できる話と、Elon Musk本人のX投稿ベースの話と、そこから先の予想が混ざりやすいからです。
なのでこの記事では、先に線を引きます。現時点で公式に確認できるGrokの現在地、X投稿ベースで見えてきたV9-Medium、そしてその先のGrok 5への見立てを分けて整理します。

結論:次の本命はV9-Medium。ただし、見るべきは「1.5T」だけじゃない
いちばん食いつきやすい数字は、たぶん「1.5T」です。現在の本番モデルとして投稿内で触れられた0.5Tのv8-smallから、V9-Mediumは約3倍の規模になる、という話です。
でも、僕が本当に大きいと思うのはそこだけではありません。むしろ重要なのは、Cursorデータが補足訓練に入ったと説明されている点です。
AIコーディングの勝負は、ただコードをたくさん読ませれば勝てる、という段階から少し進んでいます。実際の開発では、プロンプト、周辺ファイル、エラー、修正の試行錯誤、最終的な着地までがつながっています。もしそこに近いデータが学習に使われているなら、Grokは「コードを書くAI」ではなく、作業の流れを読むAIに近づく可能性があります。

いま公式に確認できるGrokの現在地
2026年5月25日時点で、xAIの公式DocsではGrok 4.3が主力モデルとして掲載されています。Docs上では、1,000,000トークンのコンテキスト、ツール呼び出し、構造化出力、設定可能な推論などが示されています。
また、xAIは5月にGrok Buildも出しています。これはターミナルから使うコーディング向けの流れで、公式のリリースノートでも早期アクセスやベータとして案内されています。つまり、xAIが最近かなり強く「開発者」「コーディング」「エージェント」に寄せているのは、公式情報から見ても自然です。
一方で、V9-Mediumという名前は、この記事を書いている時点では公式Docsのモデル一覧には載っていません。ここは大事です。だから、V9の話は「xAI公式ページで一般公開されたモデル」という扱いではなく、Elon MuskのX投稿ベースの次期モデル情報として読むのが安全です。
Elon Muskの投稿で見えたV9-Medium
Elon MuskのX投稿ベースでは、Grokの次期基盤モデルとしてV9-Mediumが語られています。内容を整理すると、だいたい次のような話です。
- Grok foundation model V9-Mediumは1.5T規模
- 訓練は完了し、評価は良好と説明
- 補足訓練にCursorデータがかなり入った
- fine-tuning中で、数日以内にreinforcement learningが始まる見込み
- 公開リリースは2〜3週間後という見立て
- 難しいコーディングタスクで、現行の0.5T v8-smallより大きく改善するという説明
ここで注意したいのは、これは本人投稿としては強い情報だけど、まだ製品ページやDocsに落ちてきた正式仕様ではない、という点です。
ただ、完全な噂だけで終わる話でもありません。xAIの公式側でもGrok 4.3、Grok Build、Grokの外部開発ツール連携が動いています。そこへV9-Mediumの投稿が重なると、xAIがコーディングAI領域をかなり本気で取りに来ている、という流れは見えます。

一番の焦点はCursorデータ
今回の話で、僕が一番見たいのはベンチマークの点数ではありません。Cursorデータを使ったことが、実際の作業感にどれだけ効くのかです。
AIコーディングで本当に困るのは、単発の関数生成ではなく、少し大きめの変更です。古いコードを読んで、影響範囲を見て、壊れそうなところを避けて、テストやエラーを見ながら直す。ここが弱いと、AIは便利だけど最後は人間が全部尻ぬぐいする感じになります。
もしV9がCursor由来の開発フローに近いデータから学んでいるなら、強くなる可能性があるのは次のあたりです。
- 複数ファイルをまたぐ修正
- エラーから原因をたどるデバッグ
- 既存コードの癖に合わせた実装
- 途中で方針を変えながら進めるエージェント作業
- ユーザーの曖昧な指示を、作業単位に分解する力
逆に言うと、ここが体感で伸びなければ、1.5Tという数字だけではそこまで驚きません。大きいモデルはすごい。でも、開発者が毎日使うAIで大事なのは「最後までやり切る安定感」です。

Grok 5の話は、まだ強く断定しない方がいい
V9の先には、当然Grok 5の話も出てきます。巨大モデルになるとか、Colossusの計算資源でさらに大きな訓練が進むとか、いろいろな見方があります。
ただ、Grok 5については、この記事では断定しません。現時点で追いやすいのは、まずV9-Mediumが本当に2〜3週間で出るのか、出たとしてコーディングの体感がどれくらい変わるのか、というところです。
Grok 5を読むなら、パラメータ数の噂よりも、次の3つを見る方が現実的だと思います。
- Grok Buildや外部ツール連携がどれだけ実用化するか
- コーディング、検索、ファイル操作、実行環境がどこまで一体化するか
- XやTesla、SpaceXを含むMusk系エコシステムの中で、Grokがどこまで深く使われるか
ここがつながると、Grokは単なるチャットAIではなくなります。文章を書くだけではなく、調べて、直して、動かして、確認するAIになります。xAIが本当に狙っているのは、たぶんそこです。

日本の開発者やビジネス層が見るべきポイント
日本でこの話が刺さる理由は、単に「ElonのAIがすごい」ではないと思います。
今、AIコーディングは個人開発者だけのものではなくなっています。社内ツール、問い合わせ対応、商品ページの改善、ログ解析、WordPress運用、簡単な業務自動化。こういう小さな仕事をAIに任せたい人が増えています。
そのときに必要なのは、きれいなサンプルコードを出すAIではありません。途中で詰まっても戻ってこられるAIです。環境を読んで、ミスを減らして、修正して、最後に使える形まで持っていくAIです。
V9-Mediumが本当に強くなるなら、Grokはこの領域で一気に存在感を上げる可能性があります。Claude、Codex、Gemini、Cursorのような開発者向けAIの競争に、xAIが正面から入ってくる形です。
気になるリスク:データの扱いは見続けたい
一方で、Cursorデータという言葉には、期待だけでなく慎重さも必要です。
どんなデータが、どの範囲で、どのように匿名化され、どのユーザーや企業の設定がどう反映されているのか。ここは外からは分かりにくい部分です。企業利用では特に重要になります。
僕は、V9が出たら性能だけでなく、データ利用の説明がどこまで出るかも見たいです。AIコーディングは仕事の中身に近い情報を扱うので、強さと透明性はセットで見た方がいいと思います。
まとめ:V9が来たら、Grokの評価はかなり変わるかもしれない
今回の話を一言でまとめるなら、Grokの次期モデルは「大きくなる」より「開発作業に寄ってくる」ことが重要です。
1.5Tという数字は派手です。2〜3週間というスピード感もxAIらしいです。でも本当の見どころは、Cursorデータを入れたことで、Grokがどれだけ実務のコーディングに強くなるかです。
もしV9-Mediumが、複雑な修正やエージェント作業で体感できるほど伸びていたら、Grokは「XについているAI」から、「開発者が選択肢に入れるAI」へかなり近づきます。
逆に、数字だけ大きくて作業の安定感が伸びなければ、話題性はあっても日常利用には残りにくいです。
だから、次に見るべきなのはベンチマークの勝ち負けだけではありません。実際に触ったときに、面倒な作業をどこまで任せられるかです。V9がそこを変えるなら、Grokの見方はかなり変わると思います。