過学習と正則化
— 訓練データに合わせすぎないための医療AI研究入門
なぜ訓練AUCは高いのに、外部データでは性能が落ちるのか。バイアス・バリアンス、正則化、交差検証を臨床例で整理します。
機械学習の入門から、深層学習、多モーダル融合、医用画像、評価、説明可能AI、歩行解析、研究デザインまで。リハビリテーション研究に必要な16部130記事を、難易度と推奨読者付きで整理しました。
医療者のための機械学習入門から医療AI研究の進め方まで、全体像をつかむ5記事
→ 医療者のための機械学習入門欠損、外れ値、標準化、特徴量設計、リーケージ防止の7記事
→ 説明変数と目的変数線形回帰、勾配ブースティング、SVM、ニューラルネット、次元削減、クラスタリング15本
→ ロジスティック回帰CNN、Transformer、GAN、Diffusion、自己教師あり学習、医用Foundation Modelの11記事
→ CNNの基礎TabPFN / TabM、半教師あり・能動学習の2記事
→ 表形式データ向けFoundation ModelDAFT、HyperFusion、Cross-Attention、TranSOPなど、医療データを統合する融合手法7記事
→ 多モーダル融合の全体像DICOM / NIfTI、MONAI、頭部CT前処理、3D-CNN、TTAの実装5記事
→ DICOM / NIfTI入門訓練/検証/テスト分割、CV、AUC・キャリブレーション・DCA・NRI・外部検証の11記事
→ train / validation / test分割過学習、リーケージ、小規模、不均衡、ショートカット学習、公平性の11記事
→ 過学習と正則化SHAP・LIME・Grad-CAM・IG・Counterfactual・CBM/ProtoPNetの10記事
→ XAIとは何か / Rudin批判MediaPipe、RTMW、MotionBERT、SMPL、ByteTrack、iPhone+PC実装7記事
→ 2D pose estimation入門PICO、TRIPOD+AI / PROBAST+AI / CLAIM、Methods、Results、査読対応の8記事
→ 研究疑問(PICO)とアウトカムの決め方seed / Docker / DVC、匿名化、クラウドAI、Bias評価、Model Cardの6記事
→ 再現性(seed / Docker / DVC)過学習、CV、AUC、DCA、リーケージ、SHAP、Grad-CAM、gaitの8デモ
→ 過学習を、グラフで体験するFIM予後予測の段階的拡張、頭部CT多モーダル、DMD動画、加速度計の7記事
→ FIM予後予測で学ぶロジ→XGBoost→DAFT脳卒中、歩行、上肢、DMD、痙縮、振動、ロボット、VR、ウェアラブル、生成AIの10記事
→ 脳卒中予後予測学びたい内容に合わせて、最初に読む記事と学習順序を示します。基礎を学びたい方から研究で使いたい方まで、段階に応じた入口を用意しました。
教師あり学習、特徴量、過学習など、臨床研究で必要になる基本語彙から積み上げます。
START →研究計画から査読対応まで、TRIPOD+AI/PROBAST+AIに沿って整理します。
COMING SOONFIM、退院時ADL、歩行自立など、リハビリテーション領域の代表的なアウトカムを題材に学びます。
PREDICT →SHAP、LIME、PDP、Grad-CAMを、臨床で誤解しないための解釈の枠組みとともに学びます。
COMING SOON脳卒中、上肢機能、DMD、ロボット、VRなど、領域別の研究動向を整理します。
COMING SOON論文要約、Methodsの執筆、査読返信など、研究プロセスごとに使えるプロンプトを整理します。
COMING SOON過学習、AUC、キャリブレーション、SHAPを、手を動かしながら理解する対話型教材です。
DEMOS →機械学習を研究に使うために必要な工程を分解しました。各ステップを行き来しながら、自分の研究に必要な深さで学べます。
分類と回帰、教師あり学習、特徴量、損失関数。
欠損、外れ値、標準化、時点。リーケージを防ぐ前処理。
ロジスティック、XGBoost、ニューラルネット。
AUC・キャリブレーション・Brier・Decision Curveを併記。
SHAP、LIME、PDP、Grad-CAM。XAIと因果の境界。
TRIPOD+AI/PROBAST+AIに沿って書く。
外的妥当性、運用、倫理、個人情報。
過学習、リーケージ、AUC、SHAP、予後予測、生成AI。医療AI研究で避けて通れないテーマを、最初に読みやすい形でまとめています。
// CURRENTLY_AVAILABLE — 公開済みの入門記事は 記事一覧、第3部 医療AI・機械学習アルゴリズム図鑑、第9部 医療AI研究の落とし穴と対策 へ
なぜ訓練AUCは高いのに、外部データでは性能が落ちるのか。バイアス・バリアンス、正則化、交差検証を臨床例で整理します。
前処理、特徴量、交差検証の設計。気づきにくいリーケージを臨床データの実例で解説します。
キャリブレーション、Brier、Decision Curve Analysis。識別能が高くても臨床に使いにくい理由を解説します。
Shapley値の定義、計算、可視化。臨床で誤読しないために、「相関と因果」の境界を整理します。
入院時データからFIM利得を予測。前処理、モデル選択、評価、解釈まで一連の流れで実装します。
PDFをそのまま入力しないプロンプト設計、ハルシネーションの確認、引用元の検証。
機械学習の概念は、図と式だけではつかみにくいものがあります。ブラウザで動く対話型教材で、過学習・AUC・キャリブレーション・SHAPを体感的に理解できます。
多項式の次数を動かしながら、訓練誤差と検証誤差の差が広がる様子を観察。
LAUNCH →閾値を動かすと感度・特異度・PPVがどう変わるか。ROCと臨床判断の関係を可視化。
LAUNCH →予測確率と実測割合のずれを、キャリブレーションプロットとBrier scoreで同時に確認。
LAUNCH →特徴量の貢献度を棒グラフで可視化。「相関」と「因果」の見え方の違いを体感。
LAUNCH →仮想データで入院時情報からFIM利得を予測。SHAPと組み合わせた解釈つき。
LAUNCH →リハビリテーション領域の英語論文を、研究デザイン、3行要約、臨床的意義まで構造化して紹介します。原著を読む前後の道しるべとして使えます。
Machine learning–based prediction of motor FIM gain in subacute stroke rehabilitation: a multicenter cohort.
入院時14変数からXGBoostでFIM運動項目利得を予測。複数施設データでAUC 0.84、外部検証で0.78を維持。SHAPによる特徴量解釈も示しています。
退院時ADLの目標設定と転帰先判断を補助する可能性があります。ただし、外部検証集団以外への一般化には検討が必要です。
Deep learning–assisted video assessment of upper-limb impairment in stroke: agreement with clinical scales.
スマホ動画から関節角度を抽出し、Fugl-Meyer・ARATスコアを推定。中等度群でICC 0.86を達成しましたが、重度群では精度が低下する傾向がありました。
遠隔評価や経時記録の選択肢になり得ます。ただし、重度症例の評価精度には注意が必要です。
Computer vision–based gait analysis in Duchenne muscular dystrophy: longitudinal feasibility study.
単眼動画から下肢キネマティクスを推定し、6MWTスコアとの相関を検討。サンプル数は限定的ですが、縦断追跡への応用可能性を示しています。
進行性疾患の在宅モニタリングへの応用が期待されますが、現時点では研究段階です。
論文読解、要約、Methodsの執筆、査読対応、HTML教材作成まで。研究者の作業フローに沿って、ChatGPT・Claude・Geminiの実践的な使い方を整理します。
PDF添付、構造化要約、批判的読解、引用検証。ハルシネーションを抑えるためのプロンプト設計。
Background / Methods / Results / Discussion を構造的に抽出するテンプレート。
査読コメントへの逐条返信、トーン調整、エビデンス補強。査読者に伝わりやすい構造化テンプレート。
TRIPOD+AIに沿ったMethods骨子の生成、用語統一、査読者からの質問を想定した自己点検。
研究教材としてのWebアプリ作成。FIM予後予測ミニデモのソースを段階的に組み立てる手順。
何を入力してよく、何を入れてはいけないか。クラウドAI、ローカルLLM、所属機関のガバナンス。
投稿前のセルフレビューに使える7項目をまとめました。各項目をクリックすると保存され、次回訪問時にも進捗が引き継がれます。
運営者は、リハビリテーション科専門医・指導医であり、医学博士・工学修士の学位を有しています。工学のバックグラウンドを生かし、臨床現場で患者さんと向き合いながら、機械学習を用いた研究に取り組んでいます。本サイトは、医療者が安心して読める正確さと、研究者が実装まで踏み込める深さの両方を目指しています。詳しいプロフィールは 運営者について を参照してください。