// PART 14 · DEMO 01

DEMO REHAB L1

過学習を、グラフで体験する

— Interactive Overfitting Demo

15 min hands-on · L1 · 2026.05.04 update · by Editor

機械学習モデルを複雑にすればするほど、訓練データを正確に予測できるようになります。しかし、未知のデータに対する予測性能はむしろ悪化することが多々あります。これが 過学習(overfitting)です。教科書で何度説明されても直感が湧きにくいこの過学習を、多項式回帰の次数などを実際にスライダーで動かしながら体感するのが本デモの目的です。訓練データ(青)とテストデータ(緑)の違いを体験してください。

// HOW TO USE

まず、右の操作パネルから、多項式の次数を 1〜3 に下げて観察してください。次に、少しずつ次数を上げて、最終の15に上げてみてください。訓練 MSE は改善傾向である一方で、テスト MSE は一旦改善するものの、その後上昇することがわかります。つまり、U字型を描くのが見えるはずです。これが過学習です。

// MULTI-DEGREE POLYNOMIAL FIT

次数を上げると、青い訓練データへの当てはまりが強くなる。

訓練データテストデータ学習モデル真の関係

// TIP 訓練 MSE が小さくなっても、テスト MSE が悪化していたら過学習。

// CONTROL PANEL

3つのパラメータで挙動を調整。

複雑さ:多項式の次数 5 次

次数が高いほど曲線は複雑に曲がる(柔軟性 ↑)。

データのばらつき 0.20

医療データは測定誤差・患者差・施設差で必ずばらつく。

訓練データ数 18 例

症例数が少ないほど、複雑なモデルは過学習しやすい。

TRAIN MSE 0.049

TEST MSE 0.071

●比較的よい汎化: 訓練とテストの誤差差が大きすぎません。

// HOW TO READ

このデモの見方。

赤い線(モデル)が青い点(訓練データ)を細かく追いかけているのに、緑の点(テストデータ)から外れる場合、未知データへの汎化性能が落ちている。これが過学習です。

良いモデル = 訓練だけでなく、未知データにも強い

01

過学習とは?

モデルが訓練データの細かなノイズまで覚えてしまい（丸暗記してしまい）、新しいデータへの性能が落ちる状態です。医療AIでは内部検証では高性能でも、別施設の外部検証では崩壊する原因の1つです。

02

なぜ危険か?

予後予測モデルで過学習が起こると「この病院の過去データには合うが、その病院での未来や別の病院の予測には使えない」モデルになってしまいます。AUC だけ高く見えても、外的妥当性が低い可能性が残るので危険です。

03

対策

train / val / test に分ける
交差検証 + bootstrap で内部検証
特徴量を増やしすぎない
正則化(Lasso / Ridge / Elastic Net)
可能なら外部検証で評価する

// RELATED関連記事で深く学ぶ

過学習と正則化
— デモで見た現象を研究設計で防ぐ

訓練性能と検証性能の差を、正則化・交差検証・外部検証の観点で整理します。

// pitfalls / overfittingREAD →

MEDICAL-AI-ALGOL2

正則化(Lasso / Ridge / Elastic Net)
— 過学習を構造的に防ぐ

本デモで体感した過学習を、目的関数のペナルティで抑える手法。Lasso / Ridge / Elastic Net の考え方を整理します。

// algorithm / regularizationREAD →

データリーケージとは何か
— 検証性能を信じてはいけない時

過学習以外で、内部検証では高性能なのに外部検証で崩れる原因を整理します。

// pitfalls / leakageREAD →

08·--11 articles

第8部モデルを正しく評価する
— 内部検証から外部検証まで

過学習を見抜く評価指標体系。AUC、Calibration、外部検証、Decision Curve を整理します。

// part 08 / evaluationREAD →