AIと人の分岐基準｜AIと人の分岐点を定める運用基準

導入：二択で終わらせず、現場で運用できる形に落とし込む
二択思考を壊す：『全部AIか全部人か』は現場の敵
判断軸で分ける：現場で測れる4軸チェックリスト
現場で止まる失敗例：承認・監視・人の割当が原因
即判断できる実務分類：自動化向き／ハイブリッド／人対応
- 結論
- 分類テンプレ（稟議に貼れる短縮版）
まず試す手順：PoCから本番までの小さく着実なロードマップ
付録：分岐チェックリスト（4軸）と採点テンプレ
- 記入例（稟議1枚スライドのサンプル）
よくある質問（抜粋）
まとめ

導入：二択で終わらせず、現場で運用できる形に落とし込む

「AIに任せるか人が介入するか」を二択で決め、閾値や責任者が未決のままPoCが止まった経験はありませんか。この記事では抽象論で終わらせず、現場で即使える判断基準と実行手順を示します。結論を先に示すと、現場で運用できる分岐基準は「測れる4軸（影響度・判定確度・検出性・運用コスト／応答時間）」を数値化し、各軸ごとに暫定閾値・SLA・承認者をセットで稟議に残すことです。

この記事で得られるもの：1) 事業責任者と合意しやすい稟議テンプレ、2) PoCですぐ試せる3つの運用ルール（テンプレ化）、3) 業界別の短いケーススタディ（SaaS／金融／医療／EC）。各章は「結論→具体的測定方法→稟議に出すべき記入例」の順で示します。

二択思考を壊す：『全部AIか全部人か』は現場の敵

結論

「全部自動化」か「全部人対応」かの二択は意思決定を麻痺させます。現場では影響度と判定確度を最小合意軸として、代表ケースごとに暫定閾値と責任者を決めるべきです。

なぜ二択が停滞を生むか（要点）

抽象的な「リスクが大きいから人」だと承認者が責任を取りにくく、稟議が差し戻されやすい。
「技術的に可能だから自動化」は影響や応答要件を無視する危険がある。
論点を「測れる指標」に落とし込み、判断を可視化することが重要。

会議で必ず出す最小1枚スライド（項目）

代表ケース（簡潔な事例文）
想定被害額のレンジと発生確率
暫定閾値（影響度スコア／confidenceの境界）
暫定承認者（氏名・連絡先）とSLA（初動時間）

実務アドバイス：まずは「この3ケースだけ」を持って行く。業界差（金融・医療など）は一文で明示し、規制がある場合は法務・コンプラの上位基準を優先する旨を明記してください。

判断軸で分ける：現場で測れる4軸チェックリスト

結論

影響度・判定確度・検出性・運用コスト／応答時間の4軸を定義し、各軸を定量化すれば関係者が同じ判断に到達できます。各軸に計測可能なメトリクスを割り当て、スコア合計で分類するルールを稟議に入れてください。

各軸の現場で使える定義

影響度：誤処理が生む想定損失（円）、影響顧客数、法務リスクの有無。会議用は「金額レンジ＋発生確率」を記載（例：想定損失 200,000円、発生確率 0.5%）。
判定確度：モデル指標（F1、精度）に加え、個別出力のconfidenceを併記。稟議で「confidence ≥85%は自動化可」等の暫定閾値を決め、過去ログで裏付ける。
検出性・再現性：誤処理をログ／アラートで検知できるか。検知までの平均時間や再現テストの可否を定義し、検出不能は高リスク扱いに。
運用コスト・応答時間：人介入に必要な平均工数（分）、1件あたり人件費、求められる応答速度（例：チャットは30分以内）。これらで「人が介入できるか」を判断する。

スコア化の実務案

各軸を0–5で評点し合計で分類（例：0–6 自動化OK／7–12 ハイブリッド／13–20 人対応）。閾値は事業責任者と運用責任者で稟議の中で決め、必ず「誰がどの数字を根拠にしたか」をスライドに残すこと。

稟議に貼る具体的テンプレ（書き方例）

ケース名：契約残額案内（チャット）
想定損失：平均200,000円（発生確率0.5%）
判定確度：過去ログ平均confidence=75%、F1=0.82
検出性：ログ/出力/ユーザーID/Timestampは保存（90日）・サンプリングで週次確認
暫定分類：ハイブリッド（confidence 60–84% → AI一次→人最終承認）
暫定承認者：事業田中太郎（t.tanaka@example.com）、運用佐藤花子（h.sato@example.com）
SLA：初動30分、重大インシデントは30分以内にインシデントコマンダー報告

現場で止まる失敗例：承認・監視・人の割当が原因

結論

承認フローの曖昧さと監視・エスカレーションの未整備が最もプロジェクトを停滞させる。稟議前に承認者一覧・監視指標・初動担当を確定し、稟議に必ず記載してください。

典型的な失敗シナリオ

PoCで精度が出るが閾値やSLAが未決で稟議提出 → 差し戻し。
本番で誤処理が顧客に届くが監視アラート未設定 → 発覚遅延・顧客クレーム拡大。
インシデント発生時に初動担当不明 → 対応遅延、経営・法務の後追い介入で信用損失。

稟議に最低限入れるべき4点（必須）

代表ケース（問い合わせサンプル）、想定影響額と暫定影響度スコア、暫定閾値とSLA、責任者（事業・運用・法務の氏名と連絡先）を明記してください。

監視・ログの実装例（最低ライン）

入力／AI出力／confidence／ユーザーID／タイムスタンプを90日保持。アラート条件例は「平均confidenceが閾値を下回る」「誤応答率が基準の2倍に増加」。初動は24時間以内、重大インシデントは30分以内にインシデントコマンダーが初回報告を行う、と稟議に明記します。

インシデント初動フロー（簡潔）

アラート発生
初動担当（運用）に自動通知
30分以内に一次対応と状況報告
重大と判定→経営・法務にエスカレーション

即判断できる実務分類：自動化向き／ハイブリッド／人対応

結論

4軸スコア合計に基づき「自動化OK／ハイブリッド／人対応必須」の3分類を運用ルールとして固定すれば恣意的判断を避けられます。合計スコアごとにSLA・監視・承認者を紐づけて運用してください。

分類テンプレ（稟議に貼れる短縮版）

自動化OK：想定損失 <100,000円、confidence ≥85%、検出性あり。運用：週次サンプリング、重大誤応答で48時間以内レビュー。
ハイブリッド：想定損失 100,000〜1,000,000円または confidence 60–84%。運用：AI一次→人最終承認（目安30分）、ピーク時の待ち行列ルールを明記。
人対応必須：想定損失 >1,000,000円または法務リスクありまたは confidence <60% または検出不能。運用：AIは補助のみ、決定は人。SLA：30分以内の初動・経営通知。

注意点：テクノロジー的に可能だからといって自動化を優先しないこと。分類後は「誰が承認するか」「どの頻度で再評価するか」を明文化し、少なくとも四半期ごとの閾値見直しをルール化してください。

まず試す手順：PoCから本番までの小さく着実なロードマップ

結論

小さな代表ケースでKPIを測り、そこで決めた閾値と承認フローを稟議で承認してから段階的に展開することが最短かつ安全です。PoCは「測ること」と「責任を決めること」が目的であり、その2点が満たされなければ本番化しないとルール化してください。

PoCの最小設計（実務チェックリスト）

対象ケース：代表的な30〜100件（業務量と多様性に応じて）
評価KPI：誤応答率、検知時間、平均人対応時間、顧客クレーム件数
検証期間：2〜6週間（短期間で有意差が出る設計を優先）
承認：事業責任者の暫定同意＋運用責任者の実行同意が必須

PoCで最初に試す3ルール（テンプレ）

ルールA（低影響自動化）：影響度スコア ≤2、confidence ≥85% → 自動応答。ログ保存90日、週次サンプリングで品質チェック。
ルールB（中影響ハイブリッド）：影響度スコア 3–6 または confidence 60–84% → AI一次処理→30分以内に人が最終承認。ピーク時のバッファ処理方針を稟議に明記。
ルールC（高影響即エスカレーション）：影響度スコア ≥7 または confidence <60% → 即時エスカレーション、運用担当が30分以内に初動、経営通知が必要な閾値は稟議で事前設定。

短いケーススタディ（実務で使える4例）

SaaS（チャット）：契約残額案内 30件サンプル。想定損失平均200,000円、confidence 75% → ルールB（ハイブリッド）。PoC後、誤案内率は0.8%→0.2%、承認平均遅延25分に収束し本番化。
金融（口座振替通知）：誤案内での資金移動可能性あり。想定損失 >1,000,000円、法務リスク高 → ルールC（人対応必須）。即時アラートと法務承認の事前同意が必須。
医療（診療ガイダンス）：誤指示で患者に重大影響。想定損失＝人命リスク（法務・規制の対象） → ルールC。AIは補助、臨床医の最終判断を必須とする稟議を用意。
EC（返品・返金判断）：1件あたり平均損失 10,000〜50,000円、confidence 88% → ルールA（自動化OK）を適用しつつ、月次サンプリングで誤処理の傾向を監視。

本番移行チェックリスト：稟議完了、SLA設定、監視/アラート実装、ログ保存機構、エスカレーション手順と担当者一覧。これらが揃って初めて「運用開始」と宣言してください。

付録：分岐チェックリスト（4軸）と採点テンプレ

現場でそのまま使える簡易版テンプレを用意しました。代表ケースを採点して合計点で分類し、稟議の根拠資料に添付してください。採点結果と暫定閾値、承認者を1枚にまとめることが重要です。

影響度（0〜5）: 0=顧客影響ほぼ無し、1=数万円程度、3=10万〜100万、5=>1,000,000円または法務リスク
判定確度（0〜5）: 0=confidence ≥95%、1=85–94%、3=70–84%、5=<60%
検出性（0〜5）: 0=即検知・再現可能、3=検知に遅延あり、5=検知不可
運用コスト・応答時間（0〜5）: 0=人介入高コストで即時不要、3=一定の人手と即時性必要、5=即時対応かつコスト高

合計点で分類：0–6 自動化OK / 7–12 ハイブリッド / 13–20 人対応。

記入例（稟議1枚スライドのサンプル）

ケース名：契約残額案内（チャット）
代表問い合わせ例：「現在の契約残額を教えてください」
想定損失：平均200,000円（発生確率0.5%）→ 影響度スコア＝4
判定確度：過去ログ平均confidence=75%、F1=0.82 → 判定確度スコア＝3
検出性：ログ/出力/ユーザーID/Timestamp保存（90日）、週次サンプリング可 → 検出性スコア＝1
運用コスト：人介入平均25分、1件当たり人件費3,000円 → 運用コストスコア＝2
合計スコア：4+3+1+2=10 → 分類：ハイブリッド
暫定ルール：confidence ≥85% → 自動化／60–84% → AI一次→人最終（30分）／<60% → 即エスカレーション
暫定承認者：事業田中太郎（t.tanaka@example.com）／運用佐藤花子（h.sato@example.com）／法務山本健（k.yamamoto@example.com）
SLA：初動30分、重大インシデントは30分以内に経営通知。ログ保持90日。

よくある質問（抜粋）

Q: チェックリストの閾値は誰が決めるべきか？

A: 暫定閾値は事業責任者が財務・顧客影響を定義し、運用責任者が実務コストとSLAを決定します。高影響領域は法務・リスク部門の最終承認を必須とし、役割分担と合意プロセスを稟議に明記してください。

Q: PoCのサンプル数や期間の目安は？

A: 代表ケース30～100件、検証期間2～6週間が実務上の目安。KPI（誤応答率・検知時間・顧客反応）を先に定義しておくことが短期で有効にするコツです。

Q: 監査やログ保存の最低要件はどこまで？

A: 最低限、入力／出力／confidence／ユーザーID／タイムスタンプを保持し、発生から90日間は参照可能にする。法規制がある場合はそれに合わせ、法務の指示を稟議に添付してください。

まとめ

導入判断は二択ではなく、「影響度・判定確度・検出性・運用コスト／応答時間」の4軸で数値化し、閾値・SLA・承認者をセットで決めることが現場で使える唯一の解です。実行手順は、1) 対象ケースを限定してPoC設計（30–100件、2–6週）→ 2) 分岐チェックリストでスコアリング→ 3) 稟議で暫定閾値・SLA・担当者を承認→ 4) 監視・ログ・エスカレーションを実装→ 5) 本番化と定期レビューです。

見送る条件も稟議で明文化してください。最後に一言：運用で使える基準とは完璧さではなく「測れること」と「責任が明確であること」です。測って合意し、記録すれば次の一歩を踏み出せます。

AIと人の分岐点を定義する運用向け例外ハンドリング基準