// PART 13 · ARTICLE 06 / 6
GENAI PRIVACY L1

生成 AI 使用時の個人情報保護

— 迷ったら入れない、仮名化と匿名化を混同しない

6 min read· L1· 2026.05.25 update· by Editor

リハビリAI医療AI 研究で ChatGPT・Claude・Claude Code などの生成 AI を使う場合、最初に確認すべきことは「何を入力してよいか」です。個人名を消しただけで安全と考えるのは誤りです。日本の個人情報保護法では、識別子を ID に置き換えた「仮名加工情報」は匿名加工情報ではなく、個人情報に準じた保護対象です。迷ったら入力しない、が基本です。

本記事では、仮名化と匿名化の違い・再同定リスクの仕組み・クラウド AI とローカル LLM のリスク比較を整理し、IRB 申請書や Acknowledgments への記載に使える 3 種のプロンプトテンプレートを提供します。

// CONTEXT

本稿は、第13部「研究プロセスに、生成AIを組み込む」の最終記事(第6記事)です。論文読解は 13·0113·02、査読対応は 13·03、Methods 起草は 13·04 を参照してください。本記事で整理する個人情報保護の原則は、第13部の全記事を通じて適用されます。

// 01 · LEARN OUTCOMESこの記事で学ぶこと

  • 仮名加工情報と匿名加工情報の違いを、個人情報保護法の定義に基づいて説明できる。
  • 再同定リスクの仕組みと、準識別子(quasi-identifier)の概念を説明できる。
  • 個人向けクラウド AI・機関向け API(ZDR)・ローカル LLM のリスク差を比較できる。
  • AI に入力してよい情報と入力してはいけない情報を分類できる。
  • IRB 申請書および論文 Acknowledgments への AI 利用記載テンプレートを使える。
  • 所属機関のガバナンス規程に沿った AI 使用ワークフローを設計できる。

// 02 · CONCLUSIONまず結論

// 03 · FIGURE仮名化・匿名化・再同定リスクを図で理解する

生成 AI に医療データを入力する前に、まず「仮名化」と「匿名化」の違いを確認します。多くの研究者が「氏名を研究 ID に置き換えたから安全」と考えていますが、対応表(リンクキー)が存在する限り、仮名加工情報は個人情報に準じて保護される対象です。

// 仮名化 vs 匿名化 · 個人情報保護法の整理 仮名加工情報 pseudonymization 識別子の処理 氏名 → ID001(対応表で復元可) 準識別子 年齢・疾患・施設名: 残存しうる 再同定リスク ● 残存する(対応表で復元可能) 日本法上の地位 個人情報に準じて保護対象 AI への入力可否 原則 NG(個人情報として扱う) 匿名加工情報 anonymization 識別子の処理 不可逆的削除(対応表を作らない) 準識別子 除去または一般化(k-匿名性) 再同定リスク ● 最小化(復元不可) 日本法上の地位 匿名加工情報として扱い可能 AI への入力可否 規約・倫理審査を確認のうえ要検討 仮名化は匿名化ではありません。仮名加工情報は対応表で元に戻せる間は個人情報に準じて保護されます。 「研究 ID に置き換えたから安全」という判断は誤りです。
Fig.1 仮名加工情報(仮名化)と匿名加工情報(匿名化)の比較。仮名化は識別子を ID に置換するが対応表で復元可能なため再同定リスクが残存し、個人情報保護法上は個人情報に準じて保護される。匿名化は不可逆処理で復元不可。

仮名化データであっても、複数の「準識別子(quasi-identifier)」が残っていると、それらを組み合わせることで個人を特定できる可能性があります。これが再同定です。単独では識別不能でも、複数の属性を組み合わせると特定できる情報の組み合わせを「準識別子」と呼びます。

// 再同定リスクの仕組み · 準識別子の組み合わせ 年齢 単独では「30代男性」→ 多数存在 希少疾患の場合は注意が必要 低リスク(単独) 疾患名 単独では「SMA 1型」→ 比較的稀 疾患によっては絞り込みが容易 中リスク(希少疾患では注意) 施設名 単独では「A 回復期病院勤務」 地域・規模が限定されると絞り込み 中リスク(小規模施設では注意) 入院期間 単独では「2020年3月入院」 他の属性と組み合わせで特定が容易 中リスク(組み合わせで高まる) 組み合わせると再同定可能 30代男性 + SMA 1型 + A 病院 + 2020年3月 → 個人特定のリスク大 k-匿名性: 同一の属性組み合わせを持つレコードが k 件以上なければ再同定リスクが高い。
Fig.2 再同定リスクの仕組み。年齢・疾患名・施設名・入院期間は単独では識別困難ですが、組み合わせると個人を特定できます。これが「準識別子(quasi-identifier)」の危険性です。仮名化後もこれらの属性が残っていると再同定が可能です。

使用する AI サービスの種類によって、データの取り扱いリスクは大きく異なります。個人向けの無料・有料サービス、機関向けの Zero Data Retention(ZDR)付き API、自端末で動作するローカル LLM では、データの送信先・学習への利用・ログ保存の方針が異なります。

// AI サービスのリスク比較マトリクス 個人向け クラウドAI (無料/有料) 機関向けAPI Zero Data Retention (ZDR) ローカルLLM 自端末インストール型 データ送信先 クラウド サーバーへ送信 クラウド 暗号化・最小保持 自端末内のみ 外部送信なし モデル学習利用 規約次第 OPT-OUT 設定要 ZDR: 利用しない 契約で明示 なし 自端末完結 ログ保存 サービス側に残る 会話履歴・ログ 最小化 契約・規程次第 端末ログ 端末管理が必要 主なリスク データ漏洩 モデル学習への流出 ZDR未確認リスク 契約条件の精査必要 端末紛失 マルウェア・共有設定 研究利用推奨度 △ 要設定確認 機関規程の確認必須 ○ ZDR確認後に推奨 機関向け契約で利用 △ 端末管理が前提 セキュリティ設定要 ローカル LLM でもリスクがゼロではありません。端末紛失・マルウェア・共有設定の確認が必要です。
Fig.3 AI サービスのリスク比較マトリクス。機関向け API(ZDR 付き)は個人データ保護の観点で相対的に推奨できますが、個人情報の入力は引き続き回避します。ローカル LLM も端末管理・セキュリティ設定が必要です。いずれのサービスでも、所属機関の AI ガバナンス規程を事前に確認します。

使用するサービスの利用規約とデータ保持ポリシーを確認し、所属機関のガバナンス指針に従います。研究目的での生成 AI 利用については、IRB・倫理委員会への事前相談を推奨します。

// 04 · CLINICALリハ領域での具体ケース

CASE 1 · カルテ要約

患者カルテをコピー&ペーストして AI に要約させる使い方は、個人情報の入力にあたるため避けます。要約が必要な場合は、個人を特定しない形で問題・治療内容・経過を文章化し、個人識別情報をすべて除いた上で AI を使います。

CASE 2 · 公開論文の抄録

PubMed や J-STAGE などで公開された論文の抄録・Methods を AI で要約・分析する用途は、個人情報リスクが比較的低い安全な使い方です。13·01 ChatGPT で医学論文を読む方法のプロンプトテンプレートを参照してください。

CASE 3 · 仮名化データ(研究 ID 置換)

氏名を研究 ID に置き換えた FIM データでも、対応表(リンクキー)が存在する限り個人情報に準じて扱います。年齢・疾患名・施設名・入院期間などの準識別子が残っていると、これらを組み合わせることで再同定が可能になる場合があります。

CASE 4 · 研究計画書・未公開原稿

未公開の研究計画書・IRB 申請書・査読中の原稿全文は、個人情報が含まれていなくても機密情報です。AI に入力した場合、当該サービスのデータ保持ポリシーによっては情報が外部に保存される可能性があります。要旨・骨子のみを使い、本文全体を入力しないことを基本にします。

// 絶対に入力しないもの

カルテ・患者氏名・生年月日・カルテ番号・MRI/CT 個人情報・電子カルテのスクリーンショット・顔が映る動画は、いかなる生成 AI にも入力しません。「匿名化したから大丈夫」という判断は、対応表が残っている限り誤りです。

// 05 · THEORY背景概念と用語整理

個人情報保護法(2022年改正)では、個人情報を「特定の個人を識別できる情報」として定義し、仮名加工情報(識別子を ID 等に置換・対応表あり)と匿名加工情報(識別子を不可逆削除・復元不可)を区別しています。仮名加工情報は利活用の拡大が図られていますが、「個人情報と組み合わせて特定の個人を識別することを禁じる」という制約が課され、対応表が存在する限り個人情報に準じた保護が必要です。

GDPR(EU 一般データ保護規則)では、pseudonymization(仮名化)を「再同定可能な処理」と位置づけており、anonymization(匿名化)とは明確に区別されます。HIPAA(米国医療情報保護法)では Safe Harbor 方式と Expert Determination 方式の 2 通りで de-identification(非識別化)を定義しています。国際共同研究では相手国の規制も確認が必要です。

観点仮名加工情報(仮名化)匿名加工情報(匿名化)
識別子の処理ID 等に置換(対応表で復元可)不可逆的削除
準識別子残存しうる除去または一般化
再同定リスク残存する最小化
日本法上の地位個人情報に準じて保護匿名加工情報として扱い可能
AI への入力可否原則 NG規約・倫理審査を確認

Zero Data Retention(ZDR)は、API プロバイダー(Anthropic・OpenAI など)がユーザーの入力データをモデル学習に使用せず、一定時間後に削除することを保証する契約形態です。個人向けの月額プランとは別に、機関向けの Enterprise 契約や API 利用で ZDR オプションが提供されます。ただし、ZDR があっても個人情報や患者データの入力を正当化するものではありません。

法規制仮名化の扱い匿名化の基準
個人情報保護法(日本)仮名加工情報: 個人情報に準じて保護匿名加工情報: 規程に沿った処理
GDPR(EU)Pseudonymization: 個人データのままAnonymization: GDPR 適用外
HIPAA(米国)規定なし(de-identification が基準)Safe Harbor / Expert Determination

// 06 · IMPLEMENTATIONコピペで使えるプロンプトテンプレート

以下のプロンプトは、公開情報または個人情報を含まない研究メモに限定して使います。個人情報そのものは入力しません。PROMPT A で投入可否を判定し、B で IRB 申請書の記載を整備し、C でマスキング済み文書の残存リスクを確認します。

// PROMPT A · 投入可否判定

使用シナリオ:特定の資料や情報を AI に入力してよいかどうかを判定するときに使う。資料の概要(個人情報は含まない)を伝え、判定と対応方法を得る。

期待出力:入力可否の分類・確認すべき機関規程・マスキングが必要な項目・安全な代替手段。

注意点:判定を求める際も、個人情報そのものは入力しない。「この資料に何が含まれているか」だけを伝える。

あなたは医療研究の情報管理と研究倫理に詳しいアドバイザーです。

以下の資料概要について、生成 AI に入力してよいかを判定してください。

【資料の概要(個人情報は含まない説明のみ)】
資料の種類: {例: 回復期脳卒中患者の FIM データ集計表}
含まれる情報: {例: 年齢・性別・入院時 FIM・退院時 FIM の集計値(個人値なし)}
個人識別子の有無: {例: 氏名・ID なし、施設名あり}

【依頼】
この資料を生成 AI に入力することの安全性を評価してください。

【出力フォーマット】
1. 分類(個人情報 / 仮名加工情報 / 匿名加工情報 / 公開情報)
2. 入力可否(OK / 要確認 / NG)と理由
3. 確認すべき規程(IRB / 機関の AI ガバナンス方針 / データ利用契約)
4. マスキングが必要な項目
5. 安全な代替手段(例: 施設名を削除する / 要約統計のみ使う)

【制約】
・個人情報そのものは入力しません。
・判定は確実ではありません。最終的には機関のガバナンス規程に従います。

// PROMPT B · IRB 申請書 AI 利用記載

使用シナリオ:IRB(倫理審査委員会)申請書に AI 利用を記載する文案を生成するときに使う。研究概要(個人情報なし)を入力し、記載骨子を得る。

期待出力:AI 利用目的・入力する情報・入力しない情報・ツール・ログ管理・リスクと低減策・IRB 確認事項の 7 項目の骨子。

注意点:この出力はあくまで骨子です。実際の申請書は研究者が機関の規程に沿って加筆・確認します。

医療 AI 研究の IRB 申請書に、生成 AI 利用に関する記載案を作ってください。

【研究概要(個人情報を含まない概略のみ)】
研究テーマ: {例: 回復期脳卒中患者の退院時 FIM 予測モデル開発}
研究期間: {例: 2026年4月–2027年3月}
対象データ: {例: 自施設 回復期病棟入院患者の後ろ向きコホートデータ}
AI 使用場面: {例: 英語論文の要約・Methods の英文下書き・解析コードの補助}

【出力フォーマット(7 項目)】
1. AI 利用の目的
2. 入力する情報(具体的に列挙)
3. 入力しない情報(個人情報・仮名化データ・未公開原稿を明記)
4. 使用するツール(ツール名・バージョン・利用形態)
5. ログ管理と履歴保存の方針
6. リスクと低減策
7. IRB・倫理委員会への確認事項

【制約】
・実際の患者情報・研究データは入力しません。
・この出力は骨子です。最終的には担当医師・倫理担当者が確認します。

// PROMPT C · マスキング確認

使用シナリオ:仮名化・匿名化の処理を施した候補文や集計表に、再同定リスクとなる情報が残っていないかを点検するときに使う。

期待出力:明示的識別子・準識別子の残存チェック・画像/動画/音声の注意事項・追加削除が必要な表現の一覧。

注意点:マスキング候補文そのものを入力する際も、個人情報の断片が含まれていないことを確認してから入力する。

以下のマスキング済み候補文について、再同定リスクを点検してください。

【マスキング済み候補文(個人情報なし・仮名化処理済みのもの)】
{マスキング処理後の文章をここに貼り付ける}

【点検観点】
1. 明示的識別子
   ・氏名・ID・生年月日・住所・電話番号が残っていないか

2. 準識別子(組み合わせで再同定の可能性があるもの)
   ・年齢(希少疾患では詳細な年齢帯は危険)
   ・疾患名・病型(希少疾患は絞り込まれる)
   ・施設名・地域(小規模施設は特定されやすい)
   ・入院期間・受診日(他の属性と組み合わせで危険)

3. 画像・動画・音声
   ・顔・体が特定できる写真や動画がないか
   ・DICOM タグなどの個人情報が含まれないか

【出力フォーマット】
- 残存する識別子・準識別子のリスト(危険度: 高/中/低)
- 追加削除または一般化が必要な表現
- AI への入力可否の最終判定(OK / 要修正 / NG)

【制約】
・この結果は参考情報です。最終確認は研究者と機関規程に従います。

// 07 · MYTHSよくある誤解

誤解 1:個人名を消せば安全です

氏名を削除しても、年齢・疾患名・施設名・入院期間・地域などの準識別子が残ると再同定できる場合があります。特に希少疾患や小規模施設のデータでは、複数の属性を組み合わせるだけで個人が特定される可能性があります。「名前を消した=匿名化」は誤りです。

誤解 2:ローカル LLM なら個人情報を入力しても安全です

ローカル LLM はデータをクラウドサーバーに送信しないため、その経路のリスクは低減されます。しかし、端末の紛失・マルウェア感染・他者による端末へのアクセス・ローカルログの残存・共有端末での使用といったリスクは残ります。個人情報の入力には機関の規程に従い慎重に判断します。

誤解 3:ChatGPT Plus(有料プラン)は医療データ対応です

個人向け月額プランと医療機関・研究機関向けの Enterprise 契約(Zero Data Retention 付き)は異なります。個人向け有料プランでもデータ保持ポリシーを確認する必要があります。研究目的での使用は、機関向け API 契約または所属機関の規程に沿った契約形態が推奨されます。

誤解 4:無料版の設定を変えれば研究利用できます

サービスごとに利用規約・データ保持設定・学習への利用オプションが異なります。設定変更でデータ学習をオプトアウトできても、それだけで研究倫理上の要件を満たすわけではありません。所属機関の AI ガバナンス方針と IRB の要件を確認したうえで利用します。

// 08 · WRITING論文・実務への組み込み方

IRB 申請書には、AI を「何に使い、何を入力しないか」を具体的に記載します。「英語論文の要約に ChatGPT を使用するが、患者の識別情報・仮名化データ・未公開原稿全文は入力しない」のように、使用場面と非入力情報を明確にします。使用するツール名・バージョン・ZDR の有無・ログ管理方法も記載します。

論文 Methods または Acknowledgments では、ICMJE 2026 の AI 利用開示要件に従い、AI ツールの使用範囲と著者による確認作業を分けて記述します。AI による出力を著者が確認・修正・承認した事実を明記することが重要です。

// ACKNOWLEDGMENTS TEMPLATE

「本研究の論文英語表現の整理に [ツール名]([提供企業])を使用しました。個人情報・患者識別情報・未公開研究データは入力していません。科学的内容・解析結果・数値の確認は著者が実施しました。」

// 09 · CHECKLIST確認リスト

  • 01入力情報に個人情報(氏名・ID・生年月日)が含まれていませんか。
  • 02仮名化データの場合、対応表がなく復元不可の状態であることを確認しましたか。
  • 03準識別子(年齢・疾患名・施設名・入院期間)が残っていませんか。
  • 04未公開データや査読中原稿全文を入力していませんか。
  • 05使用する AI サービスのデータ保持ポリシー(ZDR 有無)を確認しましたか。
  • 06所属機関の AI ガバナンス規程を確認しましたか。
  • 07IRB 申請書に AI 利用を記載しましたか(または担当者に相談しましたか)。
  • 08AI 支援の範囲と著者確認の事実を記録しましたか。
  • 09MRI/CT や顔が映る動画・画像をアップロードしていませんか。
  • 10電子カルテ画像・スクリーンショットを使っていませんか。
  • 11ローカル LLM の場合、端末のセキュリティ設定(マルウェア対策・共有設定)を確認しましたか。
  • 12ICMJE 2026 の AI 利用開示要件を確認しましたか。

// 10 · QUIZ理解度チェック

  1. 仮名加工情報は個人情報保護法上どのように扱われますか。

    1. 匿名加工情報と同等なので AI に入力できる
    2. 個人情報に準じて保護される対象である
    3. 公開情報として自由に利用できる
    4. 対応表を削除すれば即座に匿名加工情報になる
    答えを見る

    答えは 2 です。仮名加工情報は識別子を ID 等に置換したものですが、対応表で元に戻せる間は個人情報に準じて保護される対象です。「仮名化 ≠ 匿名化」です。

  2. 再同定リスクが最も高まるのはどの場合ですか。

    1. 公開論文の抄録だけを入力したとき
    2. 年齢・疾患名・施設名・入院期間を組み合わせたとき
    3. 架空データのみを使ったとき
    4. 集計値(平均・標準偏差)のみを入力したとき
    答えを見る

    答えは 2 です。単独では識別不能でも、複数の準識別子(年齢・疾患・施設・入院期間)を組み合わせると個人が特定できる可能性があります。

  3. Zero Data Retention(ZDR)が意味することはどれですか。

    1. ユーザーが無制限に入力できる保証
    2. API プロバイダーが入力データをモデル学習に使用しない契約
    3. データが永久に保存される仕組み
    4. ローカル LLM の設定項目
    答えを見る

    答えは 2 です。ZDR は API プロバイダーがユーザーの入力データをモデル学習に使用せず、一定時間後に削除することを保証する契約形態です。ただし ZDR があっても個人情報の入力を正当化しません。

  4. IRB 申請書への AI 利用記載で最も重要な内容はどれですか。

    1. AI ツールのライセンス価格
    2. 入力する情報と入力しない情報を具体的に分けた記載
    3. AI の会社の設立年
    4. 使用端末の型番
    答えを見る

    答えは 2 です。「何に使い、何を入力しないか(特に個人情報・仮名化データ・未公開原稿を入力しないこと)」を具体的に記載することが重要です。

// 11 · FAQよくある質問

研究 ID に置き換えた仮名化データは AI に入力できますか。
原則として入力しません。仮名加工情報は対応表で元の個人情報に戻せる状態が続く限り、個人情報に準じて保護されます。また年齢・疾患名・施設名・入院期間などの準識別子が残っていると、組み合わせによる再同定が可能です。「ID に変えたから安全」という判断は誤りです。
ローカル LLM なら個人情報を入力しても安全ですか。
安全とは言えません。クラウド経由の情報漏洩リスクは低減されますが、端末紛失・マルウェア・共有設定・ローカルログのリスクは残ります。ローカル LLM でも、個人情報の入力は所属機関のガバナンス規程に沿って慎重に判断します。
AI をどの範囲まで研究に使えますか。
公開論文の要約・英語表現の整備・論文骨子の生成・解析コードの補助には使えます。患者識別情報・仮名化データ・未公開研究データ・査読中原稿全文は入力しません。判断・数値・解析結果の確認は研究者が行います。
論文に AI 利用をどう記載すればよいですか。
ICMJE 2026 に従い、Acknowledgments に使用ツール・使用範囲・著者による確認作業を記載します。Methods に記載する場合は「英語表現の整備に [ツール名] を使用した。科学的内容・解析結果の確認は著者が行った。」のように書きます。雑誌規程を事前に確認します。

// REF参考文献

  1. 個人情報保護委員会. 個人情報の保護に関する法律についてのガイドライン(通則編・仮名加工情報編・匿名加工情報編). 2022年改正版.
  2. European Parliament and Council. Regulation (EU) 2016/679 (General Data Protection Regulation). Official Journal of the European Union 2016;L119:1-88.
  3. US Department of Health and Human Services. Guidance Regarding Methods for De-identification of Protected Health Information in Accordance with the Health Insurance Portability and Accountability Act (HIPAA) Privacy Rule. 2012.
  4. International Committee of Medical Journal Editors. Recommendations for the Conduct, Reporting, Editing, and Publication of Scholarly Work in Medical Journals: AI use by authors. ICMJE Recommendations 2026.
  5. World Health Organization. Ethics and governance of artificial intelligence for health. World Health Organization 2021.
  6. Bender EM, Gebru T, McMillan-Major A, Shmitchell S. On the dangers of stochastic parrots: can language models be too big? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency 2021;610-623.