よへラボブログ | Grok V9-Medium、コーディングAI戦争に本気で来るか—

Elon Musk氏がXで投稿した内容をもとに、Grokの次期基盤モデルらしき「V9-Medium」が話題になっています。投稿では、1.5T規模のモデル、Cursorデータの追加、そして2〜3週間後の公開見込みが語られています。

ただ、僕はここを少し冷静に見たいです。派手な数字より大事なのは、Grokが本当にコーディング実務で使いやすくなるのかです。そこが変わるなら、この話はかなり大きいです。

何が投稿されたのか

今回の話は、Musk氏のX投稿が出発点です。内容を要約すると、Grok foundation model V9-Mediumの訓練が完了し、評価は良好。補足訓練でCursorデータを多く追加し、今後も追加予定。現在はfine-tuning中で、数日後にreinforcement learningへ進み、公開までは2〜3週間、という流れです。

ここで大事なのは、まだ一般公開されたモデルではないことです。つまり、現時点で分かっているのは投稿ベースの工程説明であって、ベンチマークの詳細や実際の使い勝手はまだ見えていません。

それでも注目される理由は分かります。現行のGrok本番トラフィックを支える0.5Tのv8-smallから、1.5TのV9-Mediumへ移るなら、規模だけで見れば約3倍です。しかも焦点が難しいコーディングタスクに向いている。

Grok v8-small 0.5TからV9-Medium 1.5Tへの規模変化を示す棒グラフ — 0.5Tから1.5Tへの規模変化を整理しました。ただし、モデルサイズだけで実務性能は決まりません。

「Cursorデータ」がいちばんざわつく理由

今回の投稿でいちばん引っかかるのは、やはりCursorデータの部分です。

Cursorは、AIを使ったコーディング支援ツールとしてかなり存在感があります。公式サイトでも、コードを書くためのagentとして強く打ち出されています。だから、Grok側にCursor由来のデータが入るという話は、単に「コードをたくさん学習しました」よりも重く見えます。

コーディングAIで本当に難しいのは、完成コードだけを読むことではありません。人間がどう迷い、どこで修正し、どのファイルを見て、どうテストして、どこで諦めずに戻るのか。その流れをどれだけ学べるかが、実務での強さに直結します。

もしCursorデータが、そうした開発の流れを強める形で使われているなら、Grokは「普通に返答するAI」よりも、作業を進めるAIとして伸びる可能性があります。

Cursor dataがGrok V9-Mediumのコーディング性能に関係する期待と注意点を示す図 — Cursorデータへの期待と、まだ確認できていない注意点を分けて見ています。

ただし、ここは盛りすぎない方がいい

一方で、ここを「GrokがClaudeやCodexを完全に超える」と言い切るのは早いです。

コーディングAIの強さは、モデル単体だけで決まりません。リポジトリの読み方、差分の作り方、テストの回し方、エラーから戻る粘り、ツール使用、速度、料金、長時間作業での安定性。全部込みで体験が決まります。

特にCursorデータについては、公開情報だけでは分からない点があります。どの範囲のデータなのか、ユーザーコードの扱いはどうなっているのか、匿名化や許諾の設計はどうなっているのか。ここは、期待と同じくらい丁寧に見た方がいいです。

項目	今見えていること	まだ分からないこと
モデル規模	投稿では1.5Tと説明され、現行0.5Tから約3倍。	サイズ増加がどれだけ実務性能に効くか。
Cursorデータ	補足訓練で多く追加されたとされる。	データの範囲、扱い、同意、品質の詳細。
公開時期	2〜3週間後という見込みが投稿されている。	予定通り出るか、公開範囲や料金はどうなるか。
コーディング性能	難しいタスクでの改善が期待されている。	Claude、Codex、Geminiなどと比べた体感差。

公開までの流れはかなり短い

投稿ベースでは、今はfine-tuning中で、数日後にreinforcement learningが始まり、2〜3週間後に公開という流れです。2026年5月25日時点で見るなら、6月中旬あたりがひとつの目安になります。

もちろん、AIモデルの公開時期は動きます。評価で問題が出れば遅れるし、限定公開から始まる可能性もあります。だから、ここも「確定日」ではなく「目安」として見ておくのが安全です。

Grok V9-Mediumの訓練完了からfine-tuning、RL、一般公開までのロードマップ図 — 投稿ベースの公開までの流れです。スケジュールは変わる可能性があります。

僕がいちばん見たいのは「修正の粘り」

僕の見方では、Grok V9-Mediumで本当に見たいのは、単発のコード生成ではありません。

難しいコーディングで大事なのは、最初の答えが当たることだけではなく、失敗したあとに戻れることです。エラーを読んで、原因を絞って、別のファイルも見て、修正して、テストして、また失敗したら別案を出す。この粘りがあるAIは、仕事でかなり使えます。

Cursorデータの話が本当に効くなら、この「開発者っぽい戻り方」が伸びるかもしれない。ここが僕は一番面白いと思っています。

逆に、チャットの回答が少し賢くなるだけなら、そこまで大きな変化ではありません。Grokが化けるかどうかは、IDEやターミナルの中でどれだけ仕事を進められるかで決まると思います。

日本の開発者にも関係ある話

日本では、AIコーディングの話になるとClaude、Cursor、Codex、GitHub Copilotあたりがよく名前に出ます。ここにGrokが本気で入ってくるなら、開発者の選択肢はかなり増えます。

特に、xAIは公式サイト上でもGrokのBuildやAPIを開発者向けに見せています。つまり、Grokは雑談AIだけではなく、コードや開発ワークフローにも入りたい。今回のV9-Mediumは、その方向をかなり強める話に見えます。

とはいえ、日本語の自然さ、ドキュメント読解、既存コードへの理解、長い作業での安定感は、実際に触らないと分かりません。ここで無理に勝敗を決めるより、公開後に同じタスクを複数モデルへ投げて比べる方がいいです。

古い0.5T系の公開話も追っておきたい

周辺では、現在の0.5T系モデルを年内にオープンソース化する話も出ています。これも本当なら面白いです。

ただ、どのモデルを、どのライセンスで、どこまで公開するのかによって意味が変わります。研究者やローカルLLM勢には刺さる話ですが、一般ユーザーや普通の開発者にとっては、まずV9-Mediumが実サービスでどれくらい使えるかの方が重要です。

まとめ：Grokが本気で「コードを書くAI」へ寄せてきた可能性

今回のGrok V9-Mediumの話は、まだ噂っぽさを残しています。公式ブログの詳細資料ではなく、Musk氏のX投稿が中心だからです。

でも、1.5T、Cursorデータ、2〜3週間後の公開見込みという組み合わせは、かなり強いニュースです。もし本当に難しいコーディングタスクで体感できる改善が出るなら、Grokの見え方は変わります。

僕は、Grokが「話題性のあるAI」から、開発者が毎日使うAIに近づけるかどうかを見たいです。

モデルサイズの大きさより、実際の修正力。派手な発表より、失敗したあとに粘れるか。そこに答えが出たとき、このニュースの本当の価値が分かると思います。

Grok V9-Medium、コーディングAI戦争に本気で来るか——「Cursorデータ追加」がざわつく理由