AIエージェントが「指示待ち」から「自律実行」に変わるとき

2026年に入り、AIを業務に導入している企業の課題は「AIに何ができるか」から「AIにどう任せるか」へ移行しています。単発のプロンプトで回答を得る使い方から、複数のタスクを連鎖させて業務プロセスごと自動化する「エージェントワークフロー」への関心が急速に高まっています。

Anthropicが公開したエージェント設計ガイドでは、ワークフローを「開発者がコードでLLMの呼び出し順序を制御するパターン」と定義し、完全自律型エージェントとは区別しています。この区別は実務上きわめて重要です。ワークフローは予測可能性が高く、本番環境に投入しやすいからです。

京谷商会では、AIスタッフ運用体制「kuevico」のもとで93名から2,000名規模へのスケールを進めてきました。その過程で得た最大の教訓は、AIエージェントの実力はワークフロー設計の質で決まるという事実です。優秀なモデルを使っていても、タスクの分解や連携の設計が雑であれば、人間が手動で修正する工数がかえって増えます。

この記事では、AIエージェントワークフローの設計パターンを体系的に整理し、京谷商会での実践事例を交えながら、来週から導入を始められる具体的な手順を解説します。

ワークフロー設計の出発点——タスク分解と依存関係の整理

AIエージェントワークフローを構築する最初のステップは、自動化したい業務プロセスを「タスク」の単位に分解することです。ここでの「タスク」とは、1つのLLM呼び出しで完結できる作業の最小単位を指します。

タスク分解では、3つの問いを順に検討します。

問い1: この業務は何段階に分かれるか? たとえば「ブログ記事を公開する」という業務は、キーワード調査→構成案作成→本文執筆→SEO評価→CMS投入という5段階に分けられます。京谷商会のAIストラテジーラボでは、記事公開を12ステップのパイプラインとして定義しています。各ステップの入力と出力が明確に定義されているため、どのステップからでも再実行が可能です。

問い2: 各段階の間にどんな依存関係があるか? 構成案が確定しなければ本文は書けませんが、キーワード調査と競合分析は同時に実行できます。この依存関係を有向グラフとして整理することで、並列実行できるタスクが見えてきます。

問い3: 各段階の出力は次の段階の入力として十分か? タスク間のインターフェースが曖昧だと、後続のタスクが「情報不足」で失敗します。たとえば、キーワード調査の出力に検索ボリュームの数値が含まれていなければ、構成案作成の段階で優先度を判断できません。各タスクの出力スキーマを事前に定義しておくことで、この問題を防げます。

京谷商会の実運用では、タスク間のデータ受け渡しをJSON形式で統一しています。各AIスタッフ(エージェント)は前工程の出力JSONを入力として受け取り、定義されたスキーマに従って処理結果を出力します。この「契約」があるからこそ、スタッフの入れ替えや処理ロジックの変更が、ワークフロー全体を壊さずに行えるのです。

3つの実装パターン——直列・並列・条件分岐

タスク分解と依存関係が整理できたら、次はワークフローの実装パターンを選びます。実務で使われるパターンは大きく3つに分かれます。

直列パターン(プロンプトチェーン)

最もシンプルなパターンです。タスクAの出力をタスクBの入力に渡し、タスクBの出力をタスクCに渡す、という一直線の流れです。AnthropicのガイドではPrompt Chainingと呼ばれています。

直列パターンの利点は、デバッグのしやすさです。どのステップで問題が起きたかが一目で分かり、そのステップだけを修正して再実行できます。京谷商会の記事生成パイプラインも、根幹は直列パターンです。キーワード確定→分析→構成→執筆→評価→投入という流れは、前のステップの出力品質を確認してから次に進む「ゲート付き直列」として機能しています。

直列パターンを採用する判断基準は、「各ステップの処理時間を合計しても許容範囲内か」です。12ステップのパイプラインでも、各ステップが数十秒で完了するなら、全体で数分程度に収まります。

並列パターン(ファンアウト・ファンイン)

複数のタスクを同時に実行し、全ての結果が揃った段階で次のステップに進むパターンです。依存関係のないタスクを並列化することで、処理時間を短縮します。

たとえば、記事生成において「競合記事の分析」と「共起語の抽出」は互いに独立しています。これらを並列実行すれば、直列で実行した場合と比べて所要時間をほぼ半分にできます。

並列パターンで注意すべきは、結果の統合ロジックです。3つの並列タスクがそれぞれ異なる形式で結果を返してきた場合、統合ステップが複雑になります。前述のJSON出力スキーマの統一が、ここでも効いてきます。

並列パターンは、処理時間の短縮だけでなくコスト最適化にも寄与します。APIの課金はトークン単位であり、並列化してもトークン数は変わりませんが、レートリミットの範囲内で処理を分散させることで、ピーク負荷を平準化できます。

条件分岐パターン(ルーティング)

入力の内容に応じて、異なるタスクに振り分けるパターンです。京谷商会のkuevico体制では、「秘書AIが振り分け、部長AIが割り当て、スタッフAIが実行する」という3層構造を採用しています。秘書AIは受け取った指示の内容を分析し、適切な部署に振り分けます。この振り分け自体が条件分岐パターンの実装です。

条件分岐の実装には2つのアプローチがあります。1つは分類用のLLM呼び出しを最初に行い、その結果に基づいてルーティングする方法。もう1つは、ルールベースで振り分ける方法です。京谷商会では、明確なキーワード(クライアント名やプロジェクト名)が含まれている場合はルールベースで即座に振り分け、曖昧な指示の場合にのみLLMによる分類を行うハイブリッド方式を採用しています。

ルールベースの振り分けは高速かつ予測可能で、LLM呼び出しのコストも発生しません。「ルールで判断が一意に決まるなら自走させる」という原則は、ワークフロー設計全般に適用できる考え方です。

京谷商会での実践——kuevicoマルチエージェント体制の設計思想

kuevicoは京谷商会が運用するAIスタッフ体制の正式名称です。古事記に登場する久延毘古(くえびこ)——世界のあらゆることを知っている山田の案山子の神——に由来しています。2026年3月時点で、部署横断的に2,000名規模のAIスタッフが業務を担当しています。

この規模のマルチエージェント体制を維持するうえで、ワークフロー設計として特に重視しているポイントが3つあります。

1. 一人一テーマの深掘り設計 各AIスタッフは1つの専門テーマだけを担当します。SEO分析の担当者が記事を書くこともなければ、ライターがデプロイを行うこともありません。この設計により、各スタッフのプロンプトエンジニアリングを深く最適化できます。汎用的なプロンプトよりも、「SEO分析だけを極めたプロンプト」の方が圧倒的に高品質な出力を返します。

2. インターフェース契約によるスタッフ間連携 前述のJSON出力スキーマに加え、各スタッフが「何を受け取り、何を出力するか」を個人ファイル(staff/{CODE}.md)に明記しています。新しいスタッフを登用する際は、このインターフェース定義を先に設計し、既存ワークフローとの整合性を検証してから業務に投入します。人事部(HRD)による7ステップの登用ワークフローがこの品質を担保しています。

3. 段階的自律性の付与 新任のスタッフには最小限の権限だけを与え、実績を確認しながら段階的に自律性を高めます。Claude Codeのhooks機構を活用し、各スタッフがアクセスできるファイル、実行できるコマンド、書き込めるデータベースを厳密に制御しています。データベースへの書き込みは原則として専門の担当者(PMQ-004 中川)のみが行い、他のスタッフは参照クエリだけを実行できるという設計です。

この「サンドボックス化されたエージェント」のアプローチは、OWASP Agentic Security Initiativeの推奨事項とも一致しています。エージェントに全権を与えるのではなく、最小権限の原則を適用することで、1つのエージェントの誤動作がシステム全体に波及するリスクを抑えています。

ガードレールとエラーハンドリングの実装

AIエージェントワークフローを本番環境で運用するには、「うまくいくケース」の設計だけでなく、「うまくいかないケース」への備えが不可欠です。

入力バリデーション

各ステップの冒頭で、入力データが期待するスキーマに合致しているかを検証します。不正な入力を受け取った場合は、後続の処理を実行せずにエラーを返します。これにより、「ゴミが入ってゴミが出る」(garbage in, garbage out)連鎖を防ぎます。

実装としては、JSONスキーマによるバリデーションが効果的です。各タスクの入力にJSON Schemaを定義しておき、タスク実行前に自動検証する仕組みを組み込みます。

リトライと指数バックオフ

LLMのAPI呼び出しは、レートリミットやサーバー負荷により一時的に失敗することがあります。Claude Codeを利用しているとHTTP 529エラーに遭遇することもあります。このような一時的な障害に対しては、指数バックオフ付きのリトライが有効です。

リトライ回数には上限を設定します。3回リトライしても成功しない場合は、人間にエスカレーションするサーキットブレーカーパターンを組み合わせます。無限リトライはコストを浪費するだけでなく、根本的な問題(プロンプトの不備やデータの破損)を隠蔽してしまいます。

ヒューマン・イン・ザ・ループ

すべてを自動化することが最適解とは限りません。外部クライアントに送付する成果物、金銭に関わる判断、不可逆な操作(データ削除やデプロイ)については、人間の承認を挟む設計が安全です。

京谷商会では、「クライアント案件は提示→承認待ち、社内案件は自走OK」というルールを採用しています。AIスタッフが作成したクライアント向けの提案資料は、Discordで担当者が京谷さん(代表)をメンションして承認を得てから送付します。一方、社内の記事生成やデータ分析は、品質基準を満たしていればAIスタッフの判断で完了まで進めます。

この「自律実行の範囲を明確に線引きする」考え方は、エージェントワークフロー全般に応用できます。判断のリスクレベルに応じて、自動実行・人間承認・人間実行の3段階に分類するのが実践的です。

ロギングと監査証跡

ワークフローの各ステップで、入力・出力・処理時間・トークン使用量をログとして記録します。京谷商会では、AI活用量トラッキングの仕組みを構築し、セッション終了時にトークン使用量を自動記録しています。

このログは、ワークフローの改善にも活用します。どのステップに最も時間がかかっているか、どのステップで失敗率が高いかを定量的に把握することで、改善すべきボトルネックが明確になります。

導入時の落とし穴と対策

AIエージェントワークフローの導入で、多くの組織がつまずくポイントを整理します。

落とし穴1: 最初から完璧を目指す 12ステップのフルパイプラインを一度に構築しようとすると、開発期間が長引き、途中で挫折しやすくなります。まずは2〜3ステップの直列パターンから始め、動作を確認してから段階的に拡張するのが現実的です。京谷商会でも、kuevicoの初期は少数のスタッフで限定的な業務を自動化するところから始めました。

落とし穴2: プロンプトだけで制御しようとする 「このケースではAを実行し、あのケースではBを実行してください」という指示をプロンプトに詰め込むと、条件が増えるにつれてプロンプトが肥大化し、精度が低下します。条件分岐はプロンプトではなく、ワークフローのコード側で制御する方が確実です。LLMには「判断」ではなく「実行」を任せるという切り分けが重要です。

落とし穴3: エージェント間のプロンプトインジェクションを考慮しない マルチエージェント構成では、あるエージェントの出力が別のエージェントの入力になります。悪意のあるデータが混入した場合、後続のエージェントが意図しない動作をする可能性があります。各エージェント間のデータ受け渡しにサニタイズ処理を組み込み、特にユーザー入力に由来するデータは厳格に検証する必要があります。

落とし穴4: 失敗事例から学ばない ワークフローが失敗した際のログを蓄積し、定期的に分析する仕組みがないと、同じ失敗を繰り返します。京谷商会では、AIスタッフの運用で経験した7つの失敗と教訓を体系的に記録し、新しいスタッフの登用時に必ず参照しています。失敗のパターンを組織知として蓄積することが、ワークフローの品質を継続的に高める唯一の方法です。

落とし穴5: コストの見積もりが甘い ワークフローのステップ数が増えるほど、LLM APIの呼び出し回数も増えます。Anthropic API Pricingを確認し、各ステップのトークン使用量を見積もったうえで、月間コストをシミュレーションしてから導入を決定してください。並列パターンはレートリミットにも影響するため、プランの上限も合わせて確認が必要です。

来週から始める最初の1歩

AIエージェントワークフローは、大規模な投資や専門チームがなくても始められます。まずは自社の業務の中から、以下の条件を満たすプロセスを1つ選んでください。

  1. 週に3回以上繰り返している定型業務であること
  2. 入力と出力が明確に定義できること(例: メールの要約→Slackへの転記)
  3. 失敗しても手動でリカバリーできること(不可逆でないこと)

この条件を満たすプロセスを見つけたら、次の手順で進めます。

まず、そのプロセスを2〜3のステップに分解します。次に、各ステップの入力・出力をJSON形式で定義します。そして、最初のステップだけをLLMで自動化し、出力の品質を1週間検証します。品質が安定したら、2番目のステップも自動化してつなげます。

「小さく始めて、検証してから拡張する」。これがエージェントワークフロー導入の鉄則です。

京谷商会がkuevico体制を2,000名規模に拡大できたのも、この原則を愚直に守り続けた結果です。最初から完成形を目指すのではなく、1つのワークフローが安定したら次のワークフローを追加し、ワークフロー同士を連携させることで、組織全体の自動化レベルを段階的に引き上げてきました。

AIエージェントの技術は急速に進化していますが、ワークフロー設計の基本原則——タスク分解、インターフェース定義、段階的拡張、ガードレールの実装——は変わりません。この基本を押さえておけば、モデルが新しくなっても、ツールが変わっても、ワークフローの骨格はそのまま使い続けられます。