公開日:2025年11月19日
公式アナウンス → https://x.ai/news/grok-4-1
マルチモーダル能力強化(特に Vision と Code 解釈)
- 画像理解の精度向上
- UIデザイン・スクリーンショット解析の成功率改善
- 画像→コード、画像→仕様抽出の成功率がアップ
- 数式認識(OCR領域)も改善
👉 Claude 3.7 と Gemini Pro 3 Preview が強い領域に追いつく形。
推論性能改善(R1系統の流れを吸収)
- “step-by-step reasoning” の傾向が以前より自然
- 論理破綻の頻度低減(※Grok特有の暴走癖が改善した)
👉 精度より論理構造の安定化がメイン。
新しい「Coding Agent」モード追加
- CLI用コード生成
- Self-debug(自己修正ロジック)
- Git diff解析 → 修正提案
👉 Cursor / Gemini CLI 対抗の意図が露骨。
パーソナリティ設定(Tone Control)拡張
- “Sassy(毒舌)”が抑えられる設定が可能に
→ Grokの荒ぶり仕様を好まない層向け改善 - 逆に“Full Chaos”モードも残存
👉 「丸くなる+狂気も残す」というMuskらしい設計。
メモリ(長期記憶)とプロファイル機能の実装強化
- 過去会話の保持精度アップ
- プロジェクト継続利用が前提
👉 GPT の「Memory」路線に追従。
実性能(レビューからの速報)
| 項目 | 3.1 → | 4.1 評価 |
|---|---|---|
| 文章生成 | 中堅 | △ → ◎(自然な文脈処理) |
| 思考・推論 | 混乱あり | 安定化(特に数学) |
| 画像理解 | 微妙 | かなり改善 |
| コーディング | 毒舌+雑 | プロ仕様寄り |
| 個性 | 混沌の化身 | 選べる狂気 |
一言でまとめると?
「暴走型天才」→「制御可能な実務AI」
(ただし、本気出せばまだ狂う)


