研究 ID に置き換えた仮名化データは AI に入力できますか？

原則として入力しません。仮名加工情報は氏名などの識別子を ID 等に置き換えたものですが、対応表（リンクキー）が存在するため、日本の個人情報保護法上は個人情報に準じて保護される対象です。AI に入力する際も、対応表と照合すれば元の個人を特定できる状態が残ります。「仮名化したから安全」と判断するのは誤りです。

ローカル LLM なら個人情報を入力しても安全ですか？

安全とは言い切れません。ローカル LLM はデータがインターネット上のサーバーに送信されないため、クラウド経由の情報漏洩リスクは低減されます。しかし、端末紛失・マルウェア感染・共有設定・ローカルログ・他者による端末へのアクセスといったリスクは残ります。ローカル LLM でも、個人情報の入力は所属機関のガバナンス規程に従い、慎重に判断します。

IRB 申請書に AI 利用をどう記載すればよいですか？

AI 利用の目的・使用するツール・入力する情報（個人情報を入力しないことを明記）・著者による確認方法・ログ管理・リスクと低減策を具体的に記載します。「論文英語校正に ChatGPT を使用するが、患者の識別情報は入力しない」のように、何に使い、何を入力しないかを分けて書くことが重要です。ICMJE 2026 の AI 利用開示要件も参照してください。

ChatGPT の無料版は入力データがモデル学習に使われますか？

OpenAI の利用規約では、デフォルト設定ではユーザーの会話がモデル改善に使用される場合があります。ただし、設定でオプトアウトすることができます。研究目的では、個人向けプランの設定確認だけでは不十分な場合があります。機関向けの Enterprise 契約や Zero Data Retention（ZDR）付き API 利用が推奨されます。所属機関の AI ガバナンス指針に従って判断します。

生成 AI 使用時の個人情報保護｜仮名化と匿名化、再同定リスク、クラウドAI安全運用

リハビリAI・医療AI 研究で ChatGPT・Claude・Claude Code などの生成 AI を使う場合、最初に確認すべきことは「何を入力してよいか」です。個人名を消しただけで安全と考えるのは誤りです。日本の個人情報保護法では、識別子を ID に置き換えた「仮名加工情報」は匿名加工情報ではなく、個人情報に準じた保護対象です。迷ったら入力しない、が基本です。

本記事では、仮名化と匿名化の違い・再同定リスクの仕組み・クラウド AI とローカル LLM のリスク比較を整理し、IRB 申請書や Acknowledgments への記載に使える 3 種のプロンプトテンプレートを提供します。

// CONTEXT

本稿は、第13部「研究プロセスに、生成AIを組み込む」の最終記事（第6記事）です。論文読解は 13·01・13·02、査読対応は 13·03、Methods 起草は 13·04 を参照してください。本記事で整理する個人情報保護の原則は、第13部の全記事を通じて適用されます。

// 01 · LEARN OUTCOMESこの記事で学ぶこと

仮名加工情報と匿名加工情報の違いを、個人情報保護法の定義に基づいて説明できる。
再同定リスクの仕組みと、準識別子（quasi-identifier）の概念を説明できる。
個人向けクラウド AI・機関向け API（ZDR）・ローカル LLM のリスク差を比較できる。
AI に入力してよい情報と入力してはいけない情報を分類できる。
IRB 申請書および論文 Acknowledgments への AI 利用記載テンプレートを使える。
所属機関のガバナンス規程に沿った AI 使用ワークフローを設計できる。

// 02 · CONCLUSIONまず結論

// 03 · FIGURE仮名化・匿名化・再同定リスクを図で理解する

生成 AI に医療データを入力する前に、まず「仮名化」と「匿名化」の違いを確認します。多くの研究者が「氏名を研究 ID に置き換えたから安全」と考えていますが、対応表（リンクキー）が存在する限り、仮名加工情報は個人情報に準じて保護される対象です。

Fig.1 仮名加工情報（仮名化）と匿名加工情報（匿名化）の比較。仮名化は識別子を ID に置換するが対応表で復元可能なため再同定リスクが残存し、個人情報保護法上は個人情報に準じて保護される。匿名化は不可逆処理で復元不可。

仮名化データであっても、複数の「準識別子（quasi-identifier）」が残っていると、それらを組み合わせることで個人を特定できる可能性があります。これが再同定です。単独では識別不能でも、複数の属性を組み合わせると特定できる情報の組み合わせを「準識別子」と呼びます。

Fig.2 再同定リスクの仕組み。年齢・疾患名・施設名・入院期間は単独では識別困難ですが、組み合わせると個人を特定できます。これが「準識別子（quasi-identifier）」の危険性です。仮名化後もこれらの属性が残っていると再同定が可能です。

使用する AI サービスの種類によって、データの取り扱いリスクは大きく異なります。個人向けの無料・有料サービス、機関向けの Zero Data Retention（ZDR）付き API、自端末で動作するローカル LLM では、データの送信先・学習への利用・ログ保存の方針が異なります。

Fig.3 AI サービスのリスク比較マトリクス。機関向け API（ZDR 付き）は個人データ保護の観点で相対的に推奨できますが、個人情報の入力は引き続き回避します。ローカル LLM も端末管理・セキュリティ設定が必要です。いずれのサービスでも、所属機関の AI ガバナンス規程を事前に確認します。

使用するサービスの利用規約とデータ保持ポリシーを確認し、所属機関のガバナンス指針に従います。研究目的での生成 AI 利用については、IRB・倫理委員会への事前相談を推奨します。

// 04 · CLINICALリハ領域での具体ケース

CASE 1 · カルテ要約

患者カルテをコピー＆ペーストして AI に要約させる使い方は、個人情報の入力にあたるため避けます。要約が必要な場合は、個人を特定しない形で問題・治療内容・経過を文章化し、個人識別情報をすべて除いた上で AI を使います。

CASE 2 · 公開論文の抄録

PubMed や J-STAGE などで公開された論文の抄録・Methods を AI で要約・分析する用途は、個人情報リスクが比較的低い安全な使い方です。13·01 ChatGPT で医学論文を読む方法のプロンプトテンプレートを参照してください。

CASE 3 · 仮名化データ（研究 ID 置換）

氏名を研究 ID に置き換えた FIM データでも、対応表（リンクキー）が存在する限り個人情報に準じて扱います。年齢・疾患名・施設名・入院期間などの準識別子が残っていると、これらを組み合わせることで再同定が可能になる場合があります。

CASE 4 · 研究計画書・未公開原稿

未公開の研究計画書・IRB 申請書・査読中の原稿全文は、個人情報が含まれていなくても機密情報です。AI に入力した場合、当該サービスのデータ保持ポリシーによっては情報が外部に保存される可能性があります。要旨・骨子のみを使い、本文全体を入力しないことを基本にします。

// 絶対に入力しないもの

カルテ・患者氏名・生年月日・カルテ番号・MRI/CT 個人情報・電子カルテのスクリーンショット・顔が映る動画は、いかなる生成 AI にも入力しません。「匿名化したから大丈夫」という判断は、対応表が残っている限り誤りです。

// 05 · THEORY背景概念と用語整理

個人情報保護法（2022年改正）では、個人情報を「特定の個人を識別できる情報」として定義し、仮名加工情報（識別子を ID 等に置換・対応表あり）と匿名加工情報（識別子を不可逆削除・復元不可）を区別しています。仮名加工情報は利活用の拡大が図られていますが、「個人情報と組み合わせて特定の個人を識別することを禁じる」という制約が課され、対応表が存在する限り個人情報に準じた保護が必要です。

GDPR（EU 一般データ保護規則）では、pseudonymization（仮名化）を「再同定可能な処理」と位置づけており、anonymization（匿名化）とは明確に区別されます。HIPAA（米国医療情報保護法）では Safe Harbor 方式と Expert Determination 方式の 2 通りで de-identification（非識別化）を定義しています。国際共同研究では相手国の規制も確認が必要です。

観点	仮名加工情報（仮名化）	匿名加工情報（匿名化）
識別子の処理	ID 等に置換（対応表で復元可）	不可逆的削除
準識別子	残存しうる	除去または一般化
再同定リスク	残存する	最小化
日本法上の地位	個人情報に準じて保護	匿名加工情報として扱い可能
AI への入力可否	原則 NG	規約・倫理審査を確認

Zero Data Retention（ZDR）は、API プロバイダー（Anthropic・OpenAI など）がユーザーの入力データをモデル学習に使用せず、一定時間後に削除することを保証する契約形態です。個人向けの月額プランとは別に、機関向けの Enterprise 契約や API 利用で ZDR オプションが提供されます。ただし、ZDR があっても個人情報や患者データの入力を正当化するものではありません。

法規制	仮名化の扱い	匿名化の基準
個人情報保護法（日本）	仮名加工情報: 個人情報に準じて保護	匿名加工情報: 規程に沿った処理
GDPR（EU）	Pseudonymization: 個人データのまま	Anonymization: GDPR 適用外
HIPAA（米国）	規定なし（de-identification が基準）	Safe Harbor / Expert Determination

// 06 · IMPLEMENTATIONコピペで使えるプロンプトテンプレート

以下のプロンプトは、公開情報または個人情報を含まない研究メモに限定して使います。個人情報そのものは入力しません。PROMPT A で投入可否を判定し、B で IRB 申請書の記載を整備し、C でマスキング済み文書の残存リスクを確認します。

// PROMPT A · 投入可否判定

使用シナリオ：特定の資料や情報を AI に入力してよいかどうかを判定するときに使う。資料の概要（個人情報は含まない）を伝え、判定と対応方法を得る。

期待出力：入力可否の分類・確認すべき機関規程・マスキングが必要な項目・安全な代替手段。

注意点：判定を求める際も、個人情報そのものは入力しない。「この資料に何が含まれているか」だけを伝える。

あなたは医療研究の情報管理と研究倫理に詳しいアドバイザーです。

以下の資料概要について、生成 AI に入力してよいかを判定してください。

【資料の概要（個人情報は含まない説明のみ）】
資料の種類: {例: 回復期脳卒中患者の FIM データ集計表}
含まれる情報: {例: 年齢・性別・入院時 FIM・退院時 FIM の集計値（個人値なし）}
個人識別子の有無: {例: 氏名・ID なし、施設名あり}

【依頼】
この資料を生成 AI に入力することの安全性を評価してください。

【出力フォーマット】
1. 分類（個人情報 / 仮名加工情報 / 匿名加工情報 / 公開情報）
2. 入力可否（OK / 要確認 / NG）と理由
3. 確認すべき規程（IRB / 機関の AI ガバナンス方針 / データ利用契約）
4. マスキングが必要な項目
5. 安全な代替手段（例: 施設名を削除する / 要約統計のみ使う）

【制約】
・個人情報そのものは入力しません。
・判定は確実ではありません。最終的には機関のガバナンス規程に従います。

// PROMPT B · IRB 申請書 AI 利用記載

使用シナリオ：IRB（倫理審査委員会）申請書に AI 利用を記載する文案を生成するときに使う。研究概要（個人情報なし）を入力し、記載骨子を得る。

期待出力：AI 利用目的・入力する情報・入力しない情報・ツール・ログ管理・リスクと低減策・IRB 確認事項の 7 項目の骨子。

注意点：この出力はあくまで骨子です。実際の申請書は研究者が機関の規程に沿って加筆・確認します。

医療 AI 研究の IRB 申請書に、生成 AI 利用に関する記載案を作ってください。

【研究概要（個人情報を含まない概略のみ）】
研究テーマ: {例: 回復期脳卒中患者の退院時 FIM 予測モデル開発}
研究期間: {例: 2026年4月–2027年3月}
対象データ: {例: 自施設 回復期病棟入院患者の後ろ向きコホートデータ}
AI 使用場面: {例: 英語論文の要約・Methods の英文下書き・解析コードの補助}

【出力フォーマット（7 項目）】
1. AI 利用の目的
2. 入力する情報（具体的に列挙）
3. 入力しない情報（個人情報・仮名化データ・未公開原稿を明記）
4. 使用するツール（ツール名・バージョン・利用形態）
5. ログ管理と履歴保存の方針
6. リスクと低減策
7. IRB・倫理委員会への確認事項

【制約】
・実際の患者情報・研究データは入力しません。
・この出力は骨子です。最終的には担当医師・倫理担当者が確認します。

// PROMPT C · マスキング確認

使用シナリオ：仮名化・匿名化の処理を施した候補文や集計表に、再同定リスクとなる情報が残っていないかを点検するときに使う。

期待出力：明示的識別子・準識別子の残存チェック・画像/動画/音声の注意事項・追加削除が必要な表現の一覧。

注意点：マスキング候補文そのものを入力する際も、個人情報の断片が含まれていないことを確認してから入力する。

以下のマスキング済み候補文について、再同定リスクを点検してください。

【マスキング済み候補文（個人情報なし・仮名化処理済みのもの）】
{マスキング処理後の文章をここに貼り付ける}

【点検観点】
1. 明示的識別子
   ・氏名・ID・生年月日・住所・電話番号が残っていないか

2. 準識別子（組み合わせで再同定の可能性があるもの）
   ・年齢（希少疾患では詳細な年齢帯は危険）
   ・疾患名・病型（希少疾患は絞り込まれる）
   ・施設名・地域（小規模施設は特定されやすい）
   ・入院期間・受診日（他の属性と組み合わせで危険）

3. 画像・動画・音声
   ・顔・体が特定できる写真や動画がないか
   ・DICOM タグなどの個人情報が含まれないか

【出力フォーマット】
- 残存する識別子・準識別子のリスト（危険度: 高/中/低）
- 追加削除または一般化が必要な表現
- AI への入力可否の最終判定（OK / 要修正 / NG）

【制約】
・この結果は参考情報です。最終確認は研究者と機関規程に従います。

// 07 · MYTHSよくある誤解

誤解 1：個人名を消せば安全です

氏名を削除しても、年齢・疾患名・施設名・入院期間・地域などの準識別子が残ると再同定できる場合があります。特に希少疾患や小規模施設のデータでは、複数の属性を組み合わせるだけで個人が特定される可能性があります。「名前を消した＝匿名化」は誤りです。

誤解 2：ローカル LLM なら個人情報を入力しても安全です

ローカル LLM はデータをクラウドサーバーに送信しないため、その経路のリスクは低減されます。しかし、端末の紛失・マルウェア感染・他者による端末へのアクセス・ローカルログの残存・共有端末での使用といったリスクは残ります。個人情報の入力には機関の規程に従い慎重に判断します。

誤解 3：ChatGPT Plus（有料プラン）は医療データ対応です

個人向け月額プランと医療機関・研究機関向けの Enterprise 契約（Zero Data Retention 付き）は異なります。個人向け有料プランでもデータ保持ポリシーを確認する必要があります。研究目的での使用は、機関向け API 契約または所属機関の規程に沿った契約形態が推奨されます。

誤解 4：無料版の設定を変えれば研究利用できます

サービスごとに利用規約・データ保持設定・学習への利用オプションが異なります。設定変更でデータ学習をオプトアウトできても、それだけで研究倫理上の要件を満たすわけではありません。所属機関の AI ガバナンス方針と IRB の要件を確認したうえで利用します。

// 08 · WRITING論文・実務への組み込み方

IRB 申請書には、AI を「何に使い、何を入力しないか」を具体的に記載します。「英語論文の要約に ChatGPT を使用するが、患者の識別情報・仮名化データ・未公開原稿全文は入力しない」のように、使用場面と非入力情報を明確にします。使用するツール名・バージョン・ZDR の有無・ログ管理方法も記載します。

論文 Methods または Acknowledgments では、ICMJE 2026 の AI 利用開示要件に従い、AI ツールの使用範囲と著者による確認作業を分けて記述します。AI による出力を著者が確認・修正・承認した事実を明記することが重要です。

// ACKNOWLEDGMENTS TEMPLATE

「本研究の論文英語表現の整理に [ツール名]（[提供企業]）を使用しました。個人情報・患者識別情報・未公開研究データは入力していません。科学的内容・解析結果・数値の確認は著者が実施しました。」

// 09 · CHECKLIST確認リスト

01入力情報に個人情報（氏名・ID・生年月日）が含まれていませんか。
02仮名化データの場合、対応表がなく復元不可の状態であることを確認しましたか。
03準識別子（年齢・疾患名・施設名・入院期間）が残っていませんか。
04未公開データや査読中原稿全文を入力していませんか。
05使用する AI サービスのデータ保持ポリシー（ZDR 有無）を確認しましたか。
06所属機関の AI ガバナンス規程を確認しましたか。
07IRB 申請書に AI 利用を記載しましたか（または担当者に相談しましたか）。
08AI 支援の範囲と著者確認の事実を記録しましたか。
09MRI/CT や顔が映る動画・画像をアップロードしていませんか。
10電子カルテ画像・スクリーンショットを使っていませんか。
11ローカル LLM の場合、端末のセキュリティ設定（マルウェア対策・共有設定）を確認しましたか。
12ICMJE 2026 の AI 利用開示要件を確認しましたか。

// 10 · QUIZ理解度チェック

仮名加工情報は個人情報保護法上どのように扱われますか。
1. 匿名加工情報と同等なので AI に入力できる
2. 個人情報に準じて保護される対象である
3. 公開情報として自由に利用できる
4. 対応表を削除すれば即座に匿名加工情報になる
答えを見る
答えは 2 です。仮名加工情報は識別子を ID 等に置換したものですが、対応表で元に戻せる間は個人情報に準じて保護される対象です。「仮名化 ≠ 匿名化」です。
再同定リスクが最も高まるのはどの場合ですか。
1. 公開論文の抄録だけを入力したとき
2. 年齢・疾患名・施設名・入院期間を組み合わせたとき
3. 架空データのみを使ったとき
4. 集計値（平均・標準偏差）のみを入力したとき
答えを見る
答えは 2 です。単独では識別不能でも、複数の準識別子（年齢・疾患・施設・入院期間）を組み合わせると個人が特定できる可能性があります。
Zero Data Retention（ZDR）が意味することはどれですか。
1. ユーザーが無制限に入力できる保証
2. API プロバイダーが入力データをモデル学習に使用しない契約
3. データが永久に保存される仕組み
4. ローカル LLM の設定項目
答えを見る
答えは 2 です。ZDR は API プロバイダーがユーザーの入力データをモデル学習に使用せず、一定時間後に削除することを保証する契約形態です。ただし ZDR があっても個人情報の入力を正当化しません。
IRB 申請書への AI 利用記載で最も重要な内容はどれですか。
1. AI ツールのライセンス価格
2. 入力する情報と入力しない情報を具体的に分けた記載
3. AI の会社の設立年
4. 使用端末の型番
答えを見る
答えは 2 です。「何に使い、何を入力しないか（特に個人情報・仮名化データ・未公開原稿を入力しないこと）」を具体的に記載することが重要です。

// 11 · FAQよくある質問

研究 ID に置き換えた仮名化データは AI に入力できますか。: 原則として入力しません。仮名加工情報は対応表で元の個人情報に戻せる状態が続く限り、個人情報に準じて保護されます。また年齢・疾患名・施設名・入院期間などの準識別子が残っていると、組み合わせによる再同定が可能です。「ID に変えたから安全」という判断は誤りです。
ローカル LLM なら個人情報を入力しても安全ですか。: 安全とは言えません。クラウド経由の情報漏洩リスクは低減されますが、端末紛失・マルウェア・共有設定・ローカルログのリスクは残ります。ローカル LLM でも、個人情報の入力は所属機関のガバナンス規程に沿って慎重に判断します。
AI をどの範囲まで研究に使えますか。: 公開論文の要約・英語表現の整備・論文骨子の生成・解析コードの補助には使えます。患者識別情報・仮名化データ・未公開研究データ・査読中原稿全文は入力しません。判断・数値・解析結果の確認は研究者が行います。
論文に AI 利用をどう記載すればよいですか。: ICMJE 2026 に従い、Acknowledgments に使用ツール・使用範囲・著者による確認作業を記載します。Methods に記載する場合は「英語表現の整備に [ツール名] を使用した。科学的内容・解析結果の確認は著者が行った。」のように書きます。雑誌規程を事前に確認します。

// REF参考文献

個人情報保護委員会. 個人情報の保護に関する法律についてのガイドライン（通則編・仮名加工情報編・匿名加工情報編）. 2022年改正版.
European Parliament and Council. Regulation (EU) 2016/679 (General Data Protection Regulation). Official Journal of the European Union 2016;L119:1-88.
US Department of Health and Human Services. Guidance Regarding Methods for De-identification of Protected Health Information in Accordance with the Health Insurance Portability and Accountability Act (HIPAA) Privacy Rule. 2012.
International Committee of Medical Journal Editors. Recommendations for the Conduct, Reporting, Editing, and Publication of Scholarly Work in Medical Journals: AI use by authors. ICMJE Recommendations 2026.
World Health Organization. Ethics and governance of artificial intelligence for health. World Health Organization 2021.
Bender EM, Gebru T, McMillan-Major A, Shmitchell S. On the dangers of stochastic parrots: can language models be too big? Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency 2021;610-623.

// 01 · LEARN OUTCOMESこの記事で学ぶこと

// 02 · CONCLUSIONまず結論

// 03 · FIGURE仮名化・匿名化・再同定リスクを図で理解する

// 04 · CLINICALリハ領域での具体ケース

// 05 · THEORY背景概念と用語整理

// 06 · IMPLEMENTATIONコピペで使えるプロンプトテンプレート

// 07 · MYTHSよくある誤解

誤解 1：個人名を消せば安全です

誤解 2：ローカル LLM なら個人情報を入力しても安全です

誤解 3：ChatGPT Plus（有料プラン）は医療データ対応です

誤解 4：無料版の設定を変えれば研究利用できます

// 08 · WRITING論文・実務への組み込み方

// 09 · CHECKLIST確認リスト

// 10 · QUIZ理解度チェック

// 11 · FAQよくある質問

// 12 · RELATED関連記事

ChatGPT で医学論文を読む方法— AI 要約・原典照合・批判的読解を分けて使う

英語論文を日本語で要約するプロンプト— PICO 構造分解と抄録・本文別の使い分け

論文の Methods を書くプロンプト— TRIPOD+AI 27 項目で骨子を生成

Claude Code で Web アプリを作る方法— FIM 予後予測ミニデモを段階構築

データリーケージ— Pipeline の順序を Methods で示す

査読者に突っ込まれる Major comment 10 選— 投稿前のセルフレビュー

// REF参考文献

ChatGPT で医学論文を読む方法
— AI 要約・原典照合・批判的読解を分けて使う

英語論文を日本語で要約するプロンプト
— PICO 構造分解と抄録・本文別の使い分け

論文の Methods を書くプロンプト
— TRIPOD+AI 27 項目で骨子を生成

Claude Code で Web アプリを作る方法
— FIM 予後予測ミニデモを段階構築

データリーケージ
— Pipeline の順序を Methods で示す

査読者に突っ込まれる Major comment 10 選
— 投稿前のセルフレビュー