Opus 4.7になったら、AI社員の半分が要らなくなった話

うちで動いているAIエージェント群を、先日Claude Opus 4.7に切り替えました。新しいモデルに乗り換えただけ——そう思っていたのですが、蓋を開けてみたら、47体いたAIエージェントのうち、かなりの数が実質的に要らなくなっていたんです。
いや、正確には「要らなくなった」のではなく、「元々要らなかったのに、前のモデルでは気づけなかった」が正しい表現かもしれません。賢いAIに切り替えたら、今までの組織の非効率が急に見えるようになった。これ、会社で優秀な人を採用したら、今までの業務フローの無駄がはっきり見えて、気まずい感じになるアレと全く同じでした。
結果として、統合・削減の対象になったエージェントやスキルは全体の20〜30%。一気にリストラ、というと過激ですが、明らかに重複していたり、使われていなかったりする機能を整理していきました。
この作業をしながら強く感じたのは、AIエージェントの組織運営は、従業員数十名規模の中小企業の組織運営と本質的に同じ問題を抱えているということ。部署間の縄張り争い、誰が何をしているか分からない問題、新人を増やせば解決すると思い込む罠——全部出ます。
この記事では、47体のAIエージェントを実際に「社員」として運営してリストラまで経験した一次体験をもとに、中小企業の組織づくりにも通じる5つの運営原則を整理しました。AI導入を検討している経営者の方はもちろん、「うちの会社、そもそも組織が機能していない気がする」と感じている方にも、何かヒントになれば嬉しいです。
なぜ「賢いAIにしたら、半分要らなくなった」のか
少し状況を補足します。うちのAIエージェントは、47体それぞれに役割を与えて運営していました。営業企画っぽい役、分析担当、コンテンツ制作、エンジニアリング、マーケティング、運営管理——部署に分けて、90個のスキル(業務マニュアルのようなもの)を配布して動かしていました。
前のモデルでも、まあまあ動いてはいたんです。でも、Opus 4.7に切り替えた瞬間、今までぼんやりしていた「誰が何の仕事をしているのか分かりにくい」状態がクッキリ見えるようになった。
人間の組織で言うなら、こういう感じです。
今までは、各部署のエースが頑張って属人的に処理していたから、組織の設計が雑でも回っていた。 でも、優秀な人を新しく採用したら、「あれ、これって二つの部署で同じ作業してますよね?」「この業務、誰の担当かハッキリしてないですよね?」と次々に指摘が出てきた。
これです。Opus 4.7は、前のモデルより一つ一つの判断が賢くなった分、「組織設計の粗さ」に突き当たるようになったんですね。
「AIスプロール」という現象
実は、この問題には既に名前がついています。AIスプロール(AI Sprawl)と呼ばれ、部署ごとに勝手にAIツールやエージェントが増殖し、誰も全体像を把握できなくなる状態を指します。都市計画で言う「スプロール現象」——郊外に無秩序に住宅が広がって、インフラが追いつかなくなる現象の、AI版ですね。

マッキンゼーも2025年のレポートで、この問題に警鐘を鳴らしています。実際、AI導入が進んだ企業で棚卸しすると「50個のツールのうち、実際に使われているのは8個だけ」というケースは珍しくない、という報告もあります。
中小企業ほど、この問題は早く深刻化します。大企業のようにIT部門や統制チームがいないため、各担当者が「これ便利そう」と思ったものを次々に導入していくからです。うちの47体という規模は、気がつけばあっという間でした。
そして、賢いモデルに切り替えた瞬間、溜まっていた負債が一気に請求書として届いたというのが今回の体験です。
47体のAIエージェントを運営して気づいた5つの原則
ここからが本題です。Opus 4.7切り替えを機にリストラまで進めた結果、組織として機能させるには、中小企業の組織運営と驚くほど同じ原則が必要だと分かりました。順番に紹介します。
原則1: まず「社員名簿」を作る。部署紹介ページより先に
リストラを検討するときに最初にやったのは、「社員名簿」づくりでした。
- 誰がいるのか(エージェント名)
- 何の部署なのか
- 何ができて、何はやってはいけないのか
- 誰が責任者なのか
- 現在稼働しているのか、お試し中なのか
この情報を一覧表にして一箇所に集める。たったこれだけです。でも、これをやる前と後で、運営のしやすさが全然違いました。
中小企業でよくあるのは、部署紹介ページ(=マニュアル)はあるのに、社員名簿はない、あるいは最新化されていないパターン。「Aさんって今もうちの会社にいるんだっけ?」となる会社、意外と多いと思います。
AIの世界でも同じで、各部署のマニュアルを書いても、全社共通の名簿がないと、似た仕事をする別のエージェントが重複して生まれる。これがスプロールの入り口です。
実際にうちで作った名簿には、各エージェントについて以下の19項目を記録しました:
- 識別番号、名前、所属、責任者
- 稼働状態、バージョン
- 受け取る入力、出す出力、使える道具
- 担当してはいけない業務(これが重要)
- コスト感、所要時間、リスク度
- 評価状態、検索用タグ、依存関係
「担当してはいけない業務」を明文化するのがコツです。中小企業でもよくある「誰の仕事でもない問題」や「あっちの部署もこっちの部署もやりたがる問題」を防ぐのと全く同じ発想ですね。
原則2: 新人採用より、今いる社員の棚卸しが先
Opus 4.7に切り替える前、私は「こういうエージェントが足りない、ああいうスキルも追加したい」と、25個の新規追加案を出していました。
でも名簿を作って冷静に見直してみると、そもそも既存の90スキルのうち、20〜30%は統合できる候補だったんです。機能が重複していたり、使われていなかったり。ここに手をつけずに新しいものを追加すれば、スプロールが加速するだけ。
この教訓は中小企業の経営にもそのまま当てはまります。
「人が足りない」と感じたら、まず既存メンバーの仕事の棚卸しをする。新規採用はその後。
業務マニュアルが古いまま、役割分担が曖昧なまま人を増やしても、混乱が深まるだけなのと同じです。うちの運用では、新エージェントの追加を一旦停止して、既存の棚卸しと統合を優先するフェーズを明示的に設けました。結果、冒頭のリストラ(統合・削減)に至ったわけです。
原則3: 「判断」と「実行」は別人にやらせる
これ、ちょっと技術寄りの話ですが、組織論的にめちゃくちゃ重要です。
AIエージェントを運営していると、こういうバグが頻発します:
「このコードをレビューしてください」と依頼 → 本来は「コードレビュー担当のエージェントを呼びましょう」と振り分けるだけのエージェントが、 なぜか自分でレビューを始めてしまう
誰かに似てませんか? 部長が現場に下りて細かい作業を始めてしまい、本来の役割である「誰に任せるか判断する」仕事が止まる、あの現象です。
この問題、人間の組織では「中間管理職が自分で抱え込む」として長年議論されてきました。AIの世界でも全く同じことが起きます。

解決策は「役割の明文化を強烈にやる」こと。具体的には、振り分け担当には以下のルールを徹底しました:
- 冒頭に大文字で「ルーティング判定のみ。タスクを自分で実行してはいけない」と書く
- 守るべき絶対ルールを箇条書きで明記
- 出力フォーマットを「担当候補3つ + それぞれの信頼度 + 除外した理由」に固定
これをやると、スコアが5点満点中2.5点 → 4.7点まで跳ね上がりました。ドキュメントを明確にするだけで、機能しなかった役割が機能するようになる——これは人間の組織でも同じだなと痛感しました。
原則4: 「二つの目」で独立チェックする
AI同士でレビューさせると、同じ系統のAIは同じ盲点を共有していることが分かりました。
うちで実験したのは、以下のような構成です:
- 仕事を実行するAI: Anthropic社のClaude
- それを評価するAI: OpenAI社のGPT
同じ会社のAIに評価させると甘くなるんです。別会社のAIに評価させると、平均で1点以上厳しい採点になりました。盲点が違うので、お互いの見落としを拾える。
これ、会計の世界で言う「ダブルチェック原則」(Four-Eyes Principle、四つの目の原則)そのものです。経理で「記帳した人と承認する人は別人にする」というアレ。中小企業でも不正防止と品質担保のために古くから使われている原則ですね。
AIを業務に導入するときも、チェックする側は別系統のAI、または人間を配置しておくのは、本当に大事です。同じAIが書いて同じAIが確認するのは、自分で書いた稟議書を自分で承認しているようなものです。
原則5: 「増やす」より「測る」が先
これが、最も痛い教訓でした。
最初、私は「このエージェントは62点、あの部署は70点」みたいな採点をしていました。でもその点数、何の根拠もない印象評価だったんです。計測していないのに「最優先課題はこれです」と決めるのは、売上データを見ずに「今期は営業1課を増員しよう」と決めるのと同じです。
正しい順序はこうでした:
- 測る仕組みを先に作る(各エージェントの仕事の質を数値化する基盤)
- 記録する仕組みを作る(誰がどれだけ呼ばれているか、成功率はどうか)
- その数値を見て判断する(どこを強化するか、何を統合するか)
中小企業でも、KPIなしで「なんとなく営業が弱い気がする」と判断して施策を打つと、だいたい外します。計測なしの意思決定は、勘に頼った経営と同じです。
うちでは、この測る仕組みを作ったあと、20個のスキルに対して合計20ポイント以上のスコア改善を実測できました。勘ではなく数値で改善点が見える状態になると、判断の質が一気に変わります。そして今回の「半分要らない」判断も、この測定データがあったからこそできました。
具体的な進め方: フェーズ別のロードマップ
理論だけだと絵に描いた餅なので、うちが実際に進めた順序を共有します。中小企業のAI導入や組織再編にも応用できるはずです。

フェーズ0: 名簿づくり(1日)
まず、今あるAIツール・エージェント・スキルの棚卸しをします。一覧表に整理するだけ。ここで「そういえばこれ、もう使ってない」が必ず見つかります。
フェーズ1: 評価基盤の整備(1〜2日)
一番大事なスキル上位20個に対して、「こういう入力が来たら、こういう出力が正解」という評価用データを用意します。これがあると、「このAIの仕事の質」を数値で測れるようになります。
社員で言うなら「業務マニュアルに沿った仕事ができているか」を客観的に評価できる物差しを作る、に近いです。
フェーズ2: 記録基盤の整備(1〜2日)
誰がどれだけ呼ばれているか、成功率はどうか、エラーが起きたらどんなパターンか——これを自動で記録する仕組みを作ります。
「最も呼ばれているエージェント」「全く呼ばれていないエージェント」「他のエージェントが失敗して代替呼び出しされているケース」が見えてきます。これが棚卸し、ひいてはリストラの判断材料になります。
フェーズ3: 統合・整理(3〜4日)
測定データを見ながら、重複している機能を統合、使われていないものを整理します。ここで初めて「数値に基づく」削減ができる。印象論で「このエージェント要らなそう」と消すと、あとで「あれ、あのエージェントいたから他のが機能してたんだ」と気づくことがあります。
フェーズ4以降: 計画的な追加
ここまで来てようやく、新規追加の検討に入ります。しかも四半期に3〜5体ペースと決めて、一気に増やさない。
中小企業の採用計画でも、「年間◯人」のペースを先に決めるのは大事ですよね。同じです。
中小企業経営者が今日から使える3つの持ち帰り
47体のAIエージェント運営と、そこからのリストラ体験から、経営者の方にそのまま使える学びを3つ抜き出します。
① ツール導入前に「名簿」と「役割表」を作る
「まずツールを入れてみる」は、規模が小さいうちしか通用しません。5〜10個を超えた時点で、名簿と役割表がないと混乱が始まると思ってください。Excelでもスプレッドシートでも構いません。
② 「評価できないものは改善できない」を肝に銘じる
AIに限らず、業務全般に言える原則です。測れる数値を先に決めてから導入する。「導入してから効果を見る」は、効果が出なかったとき「何が悪かったか」が絶対に分からなくなります。
③ 新規追加の前に、既存の棚卸しを
新しいAIツールが話題になるたびに契約したくなる気持ち、分かります。でも、今あるツールの使用率が50%を切っているなら、追加する前に棚卸しです。人を増やす前に、今いる人の役割を整理するのと同じ。
まとめ: AIエージェントの組織運営は、結局「経営」である
Opus 4.7への切り替えをきっかけに47体をリストラしてみて一番実感したのは、これは技術の問題ではなく、経営と組織論の問題だということです。
- 人数を増やせば強くなると思い込む罠
- 誰が何をやるかの役割分担の曖昧さ
- 判断する人と実行する人の分離
- 品質を保つためのダブルチェック
- 測らずに判断しようとする危険性
全部、中小企業の経営者が日々向き合っている課題そのものです。言い換えれば、良い会社を作るのが得意な経営者は、AIエージェントの組織運営も得意になれるということでもあります。
AI導入の本質は、ツールを入れることではありません。「AIという新しい社員が何人か増えた前提で、組織をどう設計しなおすか」という経営判断です。その視点で向き合えば、単なる業務効率化を超えた成果が見えてくるはずです。
そして、モデルのアップデートはこれからも定期的に起きます。今回のOpus 4.7のように、次の賢いモデルが来たときに「組織の無駄」が炙り出されるのは、むしろ歓迎すべきこと。そのとき慌てないために、今のうちから名簿・評価・記録の三点セットを整えておくと、スムーズに対応できると思います。
もしこの記事が、自社のAI活用や組織運営のヒントになれば嬉しいです。具体的な進め方についてのご相談があれば、お気軽にお声がけください。

