現役のITエンジニアが、 システム開発の現場で求められる知識を発信
記事検索
公開

生成AIにどこまで業務情報を入れてよいのか?

生成AI関連

はじめに

生成AIの業務利用が広がるにつれ、次のような質問をよく聞きます。

  • Javaの接続文字列を、そのままAIに貼ってよいのか
  • ソースコードに company や stockHolder のような語があるだけで、業務内容を推測されないか
  • /etc/hosts や本番設定ファイルを、IPアドレスやホスト名つきで投げてよいのか

機密情報全般の整理は、以前の記事で扱いました。

生成AI関連
生成AIに機密情報を渡していいの?

今回はその続編として、SIerなどの現場でSEやPMが案件単位での生成AI利用をどう考えるべきか?をまとめます。
なお、個別案件では顧客契約・社内規程・法務判断を何よりも優先する必要があります。本記事はあくまで考える指針としてご一読ください。また、製品仕様や公的資料は2026年4月17日時点の公開情報を前提にしています。

結論

「どこまで業務情報を入れてよいか」を判断するには、2つの軸を分けて考えるのが実務上理解しやすくなります。

軸1: データガバナンス――誰がデータの行き先を統制するか

最初に見るべきなのは、生成AIサービスをどの契約形態で使用しているかです。プランや契約形態によって、データが学習に使われるか、どこに保存されるか、管理権限があるかが変わります。

契約・プランの形態 入力しやすい情報 入力前に必ず確認すること 原則そのまま入れない情報
コンシューマ向け(個人/無料プラン) 公開済み資料、一般論、ダミー化したサンプル そもそも案件で利用許可があるか 認証情報、個人データ、本番設定、顧客固有情報
企業向け(ビジネス/エンタープライズ契約) 伏字化したコード断片、最小化した社内文書 契約、保存、外部連携、管理機能 生パスワード、本番値、未マスク個人情報
API利用(自社アプリケーション経由) マスキング済み入力、用途限定の業務データ 監査、RBAC、保持期間、第三者送信 人が直接貼った秘密情報、統制なしの広範囲データ

軸2: ツールアクセスの範囲――AIが触れるデータはどこまで広がるか

もう一つ見るべきなのは、そのAIツールが何にアクセスできるかです。

  1. 手動入力型(チャットUI)

    ユーザーが選んで貼り付けた情報だけがAIに渡ります。情報の範囲は人間が制御できます。
  2. エージェント型(CLI/IDE統合)

    ファイルシステム、ターミナル、Web検索、MCP連携など、人が明示的に渡していない情報も処理対象になり得ます。作業ディレクトリに秘密情報が混在していないか、どの外部サービスと連携するかを事前に設計する必要があります。

この2軸は独立しています。チャット型でもコンシューマプランで使えばデータ管理の責任は軽減されず、エージェント型でも企業向け契約とアクセス設計を組み合わせれば統制が効きます。

AI利用形態ごとの情報入力リスクレベル

軸1(データガバナンス)と軸2(ツールアクセス範囲)の2軸で考えることで、利用形態にかかわらず判断の筋道が一定になる

経済産業省は2025年2月に AIの利用・開発に関する契約チェックリスト を公表し、2026年3月31日には AI事業者ガイドライン(第1.2版) を更新しています。
ここから見えてくるのは、AI利用は「便利だから何に使用してもOK」ではなく、契約・データ分類・最小化・統制で管理するテーマだということです。

実務では契約が最優先

現場では法務論より先に、顧客契約で許されているかを見るべきでしょう。
経産省の契約チェックリストは、AIサービス利用時に少なくとも次の観点を確認するよう促しています。

  • 提供データの利用範囲
  • 想定外利用や第三者提供の有無
  • セキュリティ水準
  • 監査条項
  • ログ保存
  • 利用規約改定の影響

特にSIerなどシステム開発を委託されている現場において、次のどれかに該当すると、契約違反になり得ます。

  • 基本契約や個別契約での秘密保持条項
  • 再委託制限
  • クラウド利用制限
  • 国外移転制限
  • 顧客のセキュリティ要件票
  • 指定ツール以外の利用禁止

つまり、OpenAIやGoogleの企業向け条件が問題なかったとしても、それだけでは足りません。案件で使ってよいかどうかは、顧客契約と社内ルールで決まります。

個人情報と営業秘密は別々に見る

「個人情報さえ入れなければ大丈夫」と考えるのは危険です。実務では、少なくとも個人情報営業秘密・秘密情報を分けて見ます。
個人情報保護委員会のQ&Aでは、氏名のみでも個人情報になり得る、住所や電話番号は他の情報と容易照合できれば個人情報になり得る、メールアドレスも内容次第で個人情報になり得ると整理されています。

参考:

さらに、外国クラウド上で個人データを扱う場合は、個人情報保護法上の論点が出ます。もっとも、個人情報保護委員会は、クラウド事業者が保存された個人データを取り扱わないこととなっている場合には、第三者への「提供」に当たらないことがあるとしています。ただし、その場合でも利用者側には安全管理措置や外国制度の把握が求められます。

参考:

一方で、個人情報ではなくても守るべき情報は大量にあります。典型的には、以下が挙げられます。

  • パスワード、APIキー、秘密鍵
  • 本番のIPアドレス、ホスト名、ドメイン名
  • 未公表の仕様、設計、テーブル構造
  • 顧客名、案件名、社内略号
  • 本番ログに含まれるユーザー情報や取引先情報

これらは不正競争防止法上の営業秘密や、契約上の秘密情報に当たり得ます。個人情報でないから大丈夫とはなりません。
では、これらの情報をAIに相談したいときは、具体的にどうすればよいのでしょうか。

実務で重要なのは「最小化」と「決定的な置換」

生成AIに相談したい内容の多くは、実際には生データを必要としません。AIに必要なのは、次のどれかであることが大半です。

  • 構文やパターン
  • エラーの種類
  • 処理の流れ
  • 依存関係や設計の癖
  • 設定の対応関係

そのため、実務では次の4原則で安全性を担保するようにしましょう。

  1. 必要な範囲だけ切り出す

    ファイル全体ではなく、関数単位、数十行単位、該当設定だけを渡します。
  1. 固有値ではなく意味を残す

    10.24.8.13 を残す必要がないなら <DB_HOST>192.0.2.13 に置き換えます。
  1. 対応関係は決定的に置換する

    主系と副系、A系とB系の関係を見せたいなら、毎回同じ規則で置換します。
  1. 秘密が混ざりやすい周辺情報を落とす

    コメント、社内URL、チケット番号、顧客名、案件コード、環境名は落とせることが多いです。

この「対応関係だけ残して実値を捨てる」という考え方は、設定ファイルやネットワーク情報で特に重要です。

最小化と決定的な置換のビフォー・アフター

実値を決定的に置換することで、AIへの相談に必要な「意味」は残しつつ「実体」を渡さない

3つの具体例で考える

例1. DB接続文字列をそのまま貼ってよいか

公開型AIにはそのまま貼らないが基本になるでしょう。企業向けAIやAPIでも、秘密値は原則マスクすることを強く推奨します。
次のようなコードは、そのまま入れるべきではありません。

java

Connection conn = DriverManager.getConnection(
    "jdbc:mysql://192.168.0.1:3306/customer_prod",
    "admin",
    "adminPassword"
);

AIに相談したいのが「接続方式が正しいか」「例外の原因は何か」であれば、必要なのは実IPや実パスワードではありません。次のように意味だけ残せば十分です。

java

Connection conn = DriverManager.getConnection(
    "jdbc:mysql://<DB_HOST>:3306/<DB_NAME>",
    "<DB_USER>",
    "<DB_PASSWORD>"
);

実務上の判断を整理すると、以下のようになります。

  • パスワード、トークン、秘密鍵は常に伏字
  • 公開型AIではホスト名、IP、DB名、ユーザー名も原則マスク
  • 企業向けAIでも、本番値は不要なら入れない
  • 代わりに、ドライバ名、接続先種別、例外メッセージ、タイムアウト設定を残す

ここで大事なのは、「実値がないとAIが答えられないか」を先に疑うことです。大半のケースでは答えは「不要」です。

例2. company や stockHolder のような語があるコードは危ないか

ここは少し丁寧に考える必要があります。companyaddressvote のような一般名詞だけで、直ちに違法になるわけではありません。ただし、コード全体の文脈が揃うと、業務ドメインや顧客業種、制度対応の内容が推測されることはあります。
たとえば、次のような情報が重なると推知性が上がります。

  • パッケージ名やクラス名が業務を直接示している
  • テーブル名やカラム名が制度や商品名を示している
  • コメントに顧客名や案件略称がある
  • エラーメッセージに社内コードや外部システム名が出ている

公開型AIに渡すなら、一般名詞を全部消す必要はありません。むしろ、意味まで消すと相談の価値が落ちます。実務的には次の整理が使いやすいです。

残してよいことが多い 置換した方がよい 原則落とした方がよい
company address status などの一般名詞 クラス名、テーブル名、パッケージ名、制度名 顧客名、案件名、社内略号、内部URL、チケット番号

また、ファイルを丸ごと投げるより、相談したい関数やロジックだけを切り出す方が安全です。これは情報保護だけでなく、AIの回答精度にも有効です。

例3. /etc/hosts や本番設定ファイルをそのまま貼ってよいか

これはさらに慎重に扱うべきです。/etc/hosts や本番設定ファイルは、個人情報でなくても内部構成・接続関係・冗長構成・命名規則を表します。そのまま出すと、システムの輪郭がかなり見えてしまいます。
公開型AIには原則そのまま投入しません。企業向けAIであっても、次はマスクしてから渡すことを推奨します。

  • 実IPアドレス
  • 実ホスト名、ドメイン名
  • 環境名、本番/検証の識別子
  • 顧客識別子
  • 踏み台、VIP、LB、DR構成がわかるコメント

マスキングするなら、関係性を保ったまま決定的に置換します。IPv4はRFC 5737で予約された 192.0.2.0/24198.51.100.0/24203.0.113.0/24、IPv6はRFC 3849の 2001:db8::/32 を例示用に使えます。
参考:

たとえば、主系・副系の対応だけ残したいなら次のようにします。

text

# 置換後の例
192.0.2.11 app-primary
192.0.2.12 app-secondary
192.0.2.21 db-primary
192.0.2.22 db-secondary
2001:db8::11 app-primary-v6
2001:db8::12 app-secondary-v6

このとき重要なのは、192.168.0.1 -> 192.0.2.11192.168.0.2 -> 192.0.2.12 のように、ペア関係だけ残して実値を捨てることです。本番構成の「意味」は残せても、「実体」は漏らさない形にできます。

迷ったときの投入前チェックリスト

最後に、現場で使いやすいチェックリストを置いておきます。どれか1つでも No なら、そのまま投入しない方が安全です。

  1. そのAIは、会社と案件の両方で利用が許可されているか
  2. 顧客契約やNDAで、外部AI利用・再委託・国外移転・ログ保存に問題がないか
  3. 個人情報、認証情報、本番値、顧客固有名詞を除去できているか
  4. 相談に必要な最小範囲まで切り出せているか
  5. 外部API、apps、MCP、Web検索などの追加送信経路を把握できているか

生成AIへの投入前チェックリストのフロー

5つの確認項目のうち1つでもNoなら、そのまま投入しない

現場で一番避けたいのは、「企業向けだから大丈夫だと思って、そのまま貼ってしまう」ことです。企業向けプランでも、秘密を最小化する責任までは肩代わりしてくれません。

まとめ

当社のようなSIerの立場で生成AIを使うときに重要なのは、AIを一律にOK/NGで語らないことです。見るべきなのは、どのAIか、どの情報か、どの契約か、どこまで最小化したかです。
判断の基軸は2つです。軸1(データガバナンス)では、コンシューマ向けには公開情報のみ、企業向けでも最小限、API経由なら統制を追加できる。軸2(ツールアクセス範囲)では、チャット型なら人が選んだ情報のみ、エージェント型ならファイル除外・外部通信・端末統制を設計する。この2軸で考えると、利用するツールが変わっても判断を大きく外しにくくなります。
特に、DB接続文字列、ソースコード断片、/etc/hosts、本番設定ファイルのような「動く材料」は、AIにとっても人間にとっても情報量が大きいので、丸投げしないのが基本です。
迷ったら、まずは契約確認 -> データ分類 -> 最小化 -> 入力環境の確認の順で見てください。そこまでやって初めて、生成AIを「安全に便利な道具」として使えるようになります。

生成AI活用支援サービスのご紹介

Tech Funでは、お客様のフェーズに合わせ、生成AI活用に向けた支援を3つのパックでご提供しています。

  1. 無料診断パック:業務・プロセスの現状を無料で診断し、生成AI活用の可能性をレポートします。
  2. 検証(PoC)パック:診断で有効性が確認された業務を対象に、プロトタイプ構築を支援します。
  3. コンサルティングサービス:生成AI導入戦略の策定から運用体制構築までを包括的に支援します。

生成AIに限らず、Web・業務システム開発やインフラ設計など、技術領域を問わずご相談を承っています。「何から始めれば良いか分からない」という段階でも構いませんので、ぜひお気軽にお問い合わせください。

執筆・編集

Tech Fun Magazine R&Dチーム
Tech Funの生成AI研究に携わるエンジニアが、最新のAIモデル動向やプロンプト設計、実業務への応用手法など、生成AIに特化した知見を執筆・編集しています。
モデル評価や業務シナリオに応じたAI活用設計など、日々のR&D活動で得られる実践的なノウハウをわかりやすく紹介します。

ARTICLE
生成AI関連記事一覧

生成AI関連

生成AIにどこまで業務情報を入れてよいのか?

生成AI関連

プロンプトキャッシュ(コンテキストキャッシュ)とは

生成AI関連

プロンプトインジェクションとは?

生成AI関連

Amazon Bedrock EvaluationsでRAG…

生成AI関連

生成AIの脅威を正しく知る ── OWASP Top 10 …

生成AI関連

マルチモーダルAIとは?「テキスト以外」の生成AI

生成AI関連

AGENTS.mdとは?AIコーディングエージェントに渡す「…

生成AI関連

コーディングエージェントを実務でどう使う?社内勉強会で見えた…

生成AI関連

生成AI用語・ツール早わかりマップ

記事一覧を見る