Claude Sonnet 4.5 登場 ─ 30時間連続稼働とエージェント時代の幕開け

TECH

Anthropic は 9月29日(米国時間)に Claude Sonnet 4.5 を発表しました。最大の特徴は、これまで7時間程度だった自律実行時間を一気に 30時間 へと延ばした点です。加えて、開発者向けの Agent SDK、強化された Claude Code、そしてアプリ内でのファイル作成機能など、AIエージェント時代を見据えた布陣が揃いました。

1. 30時間連続稼働 ─ Opus 4からの飛躍

  • Sonnet 4.5は内部テストで30時間の自律タスクを完走。
  • 1.1万行規模のチャットアプリ構築に成功。
  • 長時間タスクが「途中で止まる」課題を大幅に改善。

2. ベンチマークで示した性能

  • OSWorld:61.4%(業界トップ、前世代比+19pt)。
  • SWE-bench Verified:77.2%(一部条件では82%も報告)。
  • 実務コード修正・PC操作において安定した首位性能。

3. 開発者向けの強化施策

  • Claude Agent SDK:メモリ管理やマルチエージェントも見据えた基盤。
  • Claude Code v2:チェックポイント機能でリワインド可能、VS Code拡張、ターミナルv2。
  • 安全に長時間の自律開発を任せられる環境を整備。

4. アプリでのファイル生成と実務応用

  • Claudeアプリ内で直接 スプレッドシート・スライド・文書を作成。
  • 「会話=成果物」に直結するフローが実現。
  • 記事制作や調査業務の“最後の一手間”を短縮。

5. 安全性とセーフティ設計

  • ASL-3準拠で出荷。
  • プロンプトインジェクション耐性、迎合・欺瞞リスクの抑制。
  • 長時間稼働でも安全に利用できる仕組みを強化。

6. 価格と提供状況

  • 既存のSonnet 4と同価格(入力$3/百万Tok、出力$15/百万Tok)。
  • Claude APIとアプリで即日利用可能。
  • Microsoft 365 Copilotなど外部連携の広がりも報告。

まとめ

Claude Sonnet 4.5は単なる精度改善にとどまらず、「AIに仕事を丸ごと任せる」未来を現実化するための基盤として登場しました。
30時間連続稼働という数字は、エージェント実用化への心理的ハードルを大きく下げるものです。今後、記事制作、開発、リサーチなど多様な領域で「Claudeに任せる」が常識化していくかもしれません。

出典

Introducing Claude Sonnet 4.5
Claude Sonnet 4.5 is the best coding model in the world, strongest model for building complex agents, and best model at ...