Code w/ Claude 2026 Tokyo:AIエージェントとソフトウェア開発の未来

はじめに

2026年6月10日に東京で開催されたAnthropic社主催の開発者向けイベント「Code w/ Claude 2026 Tokyo」のレポートをお届けします。AI技術がチャットツールから自律型エージェントへと急速な進化を遂げる中、本イベントは最前線の情報が発信される場として大きな注目を集めました。

イベント概要

本イベントは、サンフランシスコ、ロンドンに続いて東京で初開催となる注目のカンファレンスです。最新のAIモデルの発表をはじめ、Claudeを活用した最先端のエージェント開発プラットフォームの紹介、そして日本を代表する企業である野村総合研究所(NRI)や楽天グループによる実践的な事例セッションが行われ、非常に内容の濃い1日となりました。

昨今、AI技術は単なるコード補完の枠を超え、自律的にタスクを遂行するエージェントへと移行しつつあります。それに伴い、実際のビジネスや開発現場において、AIをどのように業務へ適用していくかという具体的なユースケースの確立が急務となっています。本イベントでは、新モデル「Claude Fable 5」の卓越した能力が明かされたほか、先進企業がいかにしてワークフローを再定義し、AIを業務に適用しているのかという点について多くの実践的な知見が共有されました。本記事では、それらの詳細について客観的な視点から詳しくレポートしていきます。

衝撃の新モデル「Claude Fable 5」と「Mythos 5」の発表

イベントのオープニングを飾った基調講演では、リリースされたばかりの最新モデル「Claude Fable 5」と「Claude Mythos 5」の発表が行われ、会場の大きな関心を集めました。

Anthropic史上最もパワフルな「Claude Fable 5」

「Claude Fable 5」は、これまでAnthropic社が一般提供してきた中で最もパワフルなモデルとして位置づけられています。特にソフトウェアエンジニアリング、知識労働、科学研究などの分野において圧倒的なパフォーマンスを発揮します。

今回発表された「Claude Fable 5」が既存モデルからどのように進化したのか。

以前のモデルでは、数分程度でコンポーネントを記述してテストを行う程度のタスク処理が中心でしたが、Fable 5では数百万トークンに及ぶ長大なコンテキストを維持することが可能です。これにより、数日間にわたって自律的にゴールに向かってタスクを実行し続けるという、飛躍的な進化を遂げています。指示を正確に理解してコードを記述するだけでなく、障害の切り分けや既存コードの分析といった「コードを読む能力」も大幅に向上している点が大きな特徴です。

また「Mythos 5」は、Fable 5と同じ基礎モデルを採用しつつ、サイバーセキュリティや生物学などのセーフガードを一部解除した、専門の研究者向けモデルとして提供されることが発表されました。

自己学習機能「Memory」と「Dreaming」

さらに、これらの最新モデルの能力を最大限に引き出すためのプラットフォーム「Claude Managed Agents」の新機能も公開されました。エージェントが過去のセッションから学びを蓄積する「Memory」機能や、過去の経験を振り返って新しい記憶として定着させる「Dreaming」といった自己学習機能が追加され、自律型AIのさらなる可能性が提示されました。

開発者体験と自律性を飛躍させる「Claude Code」の新機能

続いて、AnthropicのApplied AIチームに所属するCharmaine氏より、「What's new in Claude Code」と題して、エージェントプラットフォーム「Claude Code」の最新アップデートが発表されました。今回のアップデートは、大きく「開発者体験(Developer experience)」と「自律性(Autonomy)」の2つのカテゴリーに分けられます。

開発者体験(Developer Experience)の向上

エージェントが自律的に長時間のタスクをこなすようになる中で、人間がツールを快適に操作できる体験設計が重視されています。

どこからでも操作可能な「Remote Control」

ローカル環境で長時間のタスクを実行させたまま席を離れても、スマートフォンやブラウザからセッションの状況を確認・操作できる機能です。外出先でもサブエージェントに新たな指示を出すことが可能になります。

快適な表示を実現する「Flicker-free rendering」

これまでターミナル上で発生していた描画のちらつき問題が解消されました。新しいフルスクリーンモードでは、画面のスクロールバックが仮想化され、ターミナル内で直接ファイルパスをクリックしたり、長時間のセッションでもメモリ使用量を一定に保つことが可能になりました。

管理を容易にする「UI refresh」

デスクトップ版やWeb版のGUIが大幅に刷新され、複数のセッションを同時に管理しやすくなりました。インラインでの差分確認、バックグラウンドタスクの監視、複数セッションの並行表示などが直感的に行えます。

自律性(Autonomy)の強化

AIがタスクの途中で些細な権限確認などで停止してしまう「無駄な待ち時間」を解消し、真の自律性を実現するための機能が多数追加されました。

権限確認を自動化する「Auto mode」

コマンド実行時の権限確認をAI自身が判断する機能です。破壊的なプロンプトやインジェクションのリスクを自動で分類し、安全な処理は人間の承認なしで実行、リスクがあるものだけをブロックしてユーザーに確認を求めます。

ブランチ衝突を防ぐ「Worktrees」

複数のエージェントが同じリポジトリで同時に作業する際のブランチ衝突(マージコンフリクト)を防ぐため、Gitのワークツリーを自動で作成・管理する機能です。

過去のセッションから学ぶ「Auto memory」

ビルドコマンドやデバッグの知見など、将来のセッションで役立つ情報をClaudeが自ら判断して記憶として蓄積し、開発者が毎回コンテキストを入力する手間を省きます。

マルチエージェントによる「Code review」

従来の「1人のレビュアーが全てを見る」アプローチとは異なり、複数のエージェントチームを立ち上げ、それぞれがコードベースの異なる部分にフォーカスして並行してレビューを行う機能です。論理エラーやセキュリティの脆弱性、リグレッションなどを検知し、その結果の妥当性をさらに別のプロセス(検証パス)で確認します。このマルチエージェントの仕組みにより、開発者が確認する前に精度の高いレビューがチーム全体で完了しており、承認作業の負担が激減するという大きなメリットがあります。

ワークフローを自動化する「Routines」と管理機能「Agent view」

Routinesを使えば、CronやGitHubのWebhook、APIトリガーを起点として、GitHubのイシューの優先順位付けなどマルチステップのワークフローを完全に自動化できます。また、Agent viewにより、実行中の全てのエージェントのステータス(待機中、作業中、完了)を一覧で監視し、フリート全体を「操縦(ステア)」する新たな開発体験が提供されます。

大規模タスクをこなす「Dynamic workflows (Ultracode)」

大規模なマイグレーションやバグハントなどの抽象的なタスクを投げると、Claudeが自ら計画を立て、必要な数だけサブエージェントを並列に立ち上げてタスクをこなし、最終的に一つに統合された結果を返す強力な機能です(「ultracode」というコマンドでトリガーされます)。

その他にも、Voiceモードの搭載、Briefモード、Windowsサポートの強化など、開発者の生産性を底上げする多数のアップデートが発表され、大きな反響を呼んでいました。

エンタープライズの先進事例と実践的アプローチ

午後からは、実際に業務へAIを適用している先進企業の事例セッションが行われ、具体的な活用手法が共有されました。

野村総合研究所(NRI):モデルではなく「業務」を評価する

NRIの北村氏によるセッションでは、エンタープライズ企業がどのようにAIモデルを選定し、業務適用を進めているのかという実践的な知見が語られました。

独自の「業務観点ベンチマーク」

「モデル評価=ベンチマーク比較だと思っていませんか?」という問いかけから始まり、NRIでは「モデルそのものを評価するのではなく、業務を評価している」という強力な方針が示されました。

NRIは独自の「業務観点ベンチマーク」を構築しており、公開されている一般的なベンチマークに頼るのではなく、複雑な社内規程と法令の整合性チェックなど、自社の実際の業務タスクをAIに解かせることで評価を実施しているそうです。

規制業界でClaudeが選ばれる理由

エンタープライズ企業、特にコンプライアンスリスクを重視する金融などの規制業界においてClaudeが選ばれる最大の理由は、「日本語の流暢さ」以上に「複雑な指示への追従性の高さ」にあります。何重もの条件や例外事項を与えられた場合でも、整合性が崩れることなく最後まで指示を忠実に守り切る能力が評価されており、これが「指示の漏れがない」という圧倒的な価値を生み出していると解説されました。

業務知識の「Skills」化


また、プロンプトに細かな工夫を詰め込むアプローチから脱却し、業務知識を「Skills」として言語化・資産化することが重要であると強調されました。これにより、モデルが進化するたびにその恩恵を自動的に受け取ることができる堅牢なパイプラインを構築することが、今後のAI活用において不可欠とされています。

楽天グループ:AI-nizationで目指す「AIの民主化」

続いて、楽天グループのカジ氏による「Rakuten's AI-nization: Autonomy × empowerment」と題したセッションが行われました。

ワークフローの再定義が鍵

楽天グループでは「AI-nization」という全社戦略のもと、AIエージェントを活用してリスクを適切に管理しつつ、イノベーションを起こすための時間とコストを最小化することを目指しています。本セッションで特に印象的だったのは、「モデルの限界を決めるのは、モデルの知能ではなく、ワークフローの設計である」という本質的なインサイトです。


モデルの知能がどれほど向上しても、社内のインフラ環境(パブリッククラウドの権限設定やインフラのコード化)、社内ルールやセキュリティポリシー、そしてAIに必要なコンテキストを渡せる状態が整備されていなければ、AIはタスクを完了させることができません。そのため、組織のワークフロー自体を根本から再定義することが最重要課題であると語られました。

新機能による驚異的な成果

また、プラットフォームの新機能である「Memory」や「Dreaming」を導入した成果として、クリティカルエラーが97%削減され、コストとレイテンシも30%以上削減できたという驚異的な実績が発表されました。これは、今日発生した失敗をAI自身が振り返り、翌朝には企業資産として改善に繋げているという、成果を複利で積み上げるメカメカニズムの賜物です。

組織内での「AIの民主化」

この結果、かつては四半期ごとにリリースを行っていたプロダクトマネージャーなどの非エンジニア社員が、自らパイプラインを動かして2週間ごとに主要なリリースを行える体制が整うなど、まさに組織内での「AIの民主化(エンパワーメント)」が実現しつつある状況が報告されました。

参加者との交流やネットワーキングの様子

セッションの合間やイベント終了後には、参加者同士での活発なネットワーキングが行われました。多様な業界のエンジニアや企画担当者が集まり、「自社のワークフローをどのように再定義すべきか」「AIエージェントにどこまでの権限を委譲すべきか」といった、現場ならではのリアルな課題感やベストプラクティスが共有され、熱気を帯びた情報交換の場となっていました。

まとめ

全体の総括

「Code w/ Claude 2026 Tokyo」は、AIが単なるコード補完ツールとしての役割を終え、自律的に働くエージェントへと完全に移行したことを強く印象付けるイベントとなりました。特にFable 5のような強力なモデルや、Ultracodeのようなダイナミックな自律機能が登場したことで、AIの知能や処理能力そのものがボトルネックとなる時代は終わりを迎えつつあることが明確に示されました。

今後の展望や注目ポイント

NRIや楽天の事例から明らかになったように、これからの企業に求められるのは、AIの能力を最大限に発揮させるための「業務の言語化」や「ワークフローの再構築」です。ソフトウェア開発の障壁が下がり、誰もが課題を言葉にするだけで抽象的な要件をエージェントが形にしてくれるこれからの時代において、企業がいかに自社のルールや業務フローを見直し、最新のエージェント環境を活用していくかが次世代の競争力を左右する鍵となるでしょう。今後のAI技術のさらなる進化と、各企業における自律型エージェントの社会実装の動向から目が離せません。

新規CTA