リハビリテーション医療では、患者さんの機能予後・ADL・歩行能力・退院後の生活を見据えた判断が日常的に求められます。こうした判断は経験と臨床推論に基づきますが、近年は機械学習・医療AIを使ってデータ駆動で支援する研究が急速に増えています。本ページは、リハビリ領域で機械学習を使い始める医療者・研究者のための入門ガイドです。
本サイト「Rehab AI Tech」では、リハビリ領域の機械学習・医療AIを 16 部 130 記事で体系化しています。本ページは「リハビリ 機械学習」で検索された方の最初の入口として、各章の重要記事へ橋渡しする役割を担います。
// 01 · CONTEXTリハビリ領域で機械学習が注目される理由
リハビリテーション医療における機械学習の活用が広がっている背景には、3 つの流れがあります。
- 電子カルテ・FIM・SIAS・歩行解析データの蓄積:回復期病棟や急性期リハ部門では、入院時から退院時まで多時点のデータが構造化された形で記録されるようになり、機械学習が扱いやすいデータセットが整いつつあります。
- 多変量・非線形な臨床問題:脳卒中の予後、認知症の進行、廃用症候群の重症化など、リハビリ領域の予測課題は多くの説明変数を非線形に組み合わせる必要があり、機械学習の得意領域と一致します。
- scikit-learn・PyTorch などのオープンソース化:かつて専門家のものだった解析手法が、Python が使える臨床医・大学院生にも届くようになりました。
この変化は「医師が AI に置き換わる」という話ではなく、「臨床的な問いを正しく立てて、データで補強する力」を医療者自身が持てるようになる、という文脈で語られるべきものです。本サイトはその姿勢で書かれています。
→ 全体像をもっと見たい方へ:医療者のための機械学習入門
// 02 · CONCEPT予後予測とは何か
予後予測(prognostic prediction)とは、ある時点で得られる情報から、将来の転帰を確率で推定することです。リハビリ領域では「入院時の情報から、退院時の自宅退院可否を予測する」「初期評価から、3 か月後の歩行自立を予測する」といった形で頻出します。
予後予測は診断とは異なる課題です。診断は「現在の状態は何か」を当てるのに対し、予後予測は「将来こうなる確率はいくつか」を答えます。そのため、評価指標も AUC・Calibration・Decision Curve Analysis など、確率予測の質を測るものが中心になります。
→ 詳しくは:予測モデルとは何か
// 03 · EXAMPLESFIM・歩行自立・自宅退院予測の具体例
リハビリ領域で頻出する予測課題を、3 つの具体例で見てみます。
入院時の FIM、年齢、発症からの日数、麻痺の重症度などを使って、退院時 FIM の利得(Gain)を回帰予測する課題。連続値の予測なので線形回帰や正則化付き線形モデル(Lasso / Ridge)がベースラインになります。
「自宅退院 / 施設退院」を 2 値分類する課題。ロジスティック回帰が標準的なモデル。確率を出すので、Calibration plot で「予測 70% は本当に 70% の人が自宅退院するか」を確認することが論文化では重要です。
「この患者と似た過去症例で、退院時の状態はどうだったか?」を検索する課題。k近傍法(kNN)が直感的で、診療支援ツールのベースとして実装しやすい手法です。
// 04 · COMPARISON従来の統計解析との違い
「重回帰やロジスティック回帰なら、すでに統計でやっている」という疑問はよく聞かれます。実際、リハビリ研究で使う線形回帰やロジスティック回帰は統計学の手法でもあり、機械学習の手法でもあります。違いは目的と評価方法にあります。
- 統計的推論は「変数間の関係を仮説検定で確かめる」ことに比重があります。p 値、信頼区間、交絡調整が中心。
- 機械学習は「未知データに対する予測精度を最大化する」ことに比重があります。Cross-Validation、AUC、外部検証が中心。
- 共通点:どちらも「データから関係性を学ぶ」ことに変わりはなく、同じモデル(ロジスティック回帰など)が使われることも多い。
両者の使い分けは、研究目的次第です。詳しい対比は 統計モデル・機械学習・生成AI で扱っています。
// 05 · MODELSよく使われるモデル
リハビリ領域の予後予測でよく使われる代表的モデルを、用途別に整理します。
- 線形系:線形回帰(連続値予測のベースライン) / ロジスティック回帰(2 値分類の最重要モデル) / 正則化(Lasso / Ridge / Elastic Net)(変数が多いときの過学習対策)
- 距離・確率系:k近傍法(kNN)(類似症例検索) / ナイーブベイズ(テキスト・症状有無の分類)
- 木・アンサンブル系:決定木 / ランダムフォレスト / 勾配ブースティング(XGBoost・LightGBM)。表形式データで高い性能を出しやすい。
- 深層学習:CNN(医用画像)、Transformer(時系列・自然言語)、医用 Foundation Model(MedSAM 等)。
最初の 1 本はロジスティック回帰がおすすめです。リハ予後予測の論文で最も登場し、解釈もしやすく、複雑なモデルとの比較ベースラインとしても外せません。
→ 全 15 アルゴリズムの図鑑:第3部 医療AI・機械学習アルゴリズム図鑑
// 06 · METRICS評価指標:AUC、感度、特異度、Calibration
機械学習モデルを「どれくらい当たるか」で評価する指標は、目的によって複数あります。リハビリ研究の予後予測では、最低限以下を理解しておきます。
- AUC(ROC 曲線下面積):識別能の代表的指標。0.5 = ランダム、1.0 = 完璧。0.7 〜 0.8 で「実用的」、0.8 〜 0.9 で「良好」と言われる。
- 感度(Sensitivity)・特異度(Specificity):閾値を決めたときの真陽性率・真陰性率。臨床判断に使うときは閾値設定が重要。
- Calibration(校正):「予測確率 70% が、実際にも 70% の人で起きているか」。AUC が高くても Calibration が崩れていれば臨床では使えない。
- Decision Curve Analysis(DCA):閾値ごとの「臨床的純利益」を計算。AUC では捉えられない、患者にとっての実利を見る指標。
- 外部検証(External Validation):別施設・別期間のデータで性能を確認。施設差・ドメインシフトに耐えるかを見る最終関門。
「AUC だけ報告して投稿」は今や査読で必ず指摘されます。AUC + Calibration + 外部検証の三点セットが標準です。
→ 過学習の検出を体感する:過学習を、グラフで体験する
// 07 · XAI説明可能AI(XAI)の重要性
機械学習モデル、特に勾配ブースティングや深層学習は予測精度が高い一方で、「なぜその予測になったのか」がブラックボックスになりがちです。医療現場では、判断根拠が示されないモデルは使いにくく、患者・家族・他職種への説明責任も果たせません。
これに応えるのが説明可能AI(Explainable AI, XAI)です。代表的な手法に SHAP、LIME、PDP(Partial Dependence Plot)、Grad-CAM(医用画像用)があります。「この予測に最も寄与した変数は何か」「FIM 認知の値が増えると予測がどう変わるか」といった問いに、数値とグラフで答えます。
ただし注意点として、SHAP 値は寄与度であって因果効果ではありません。「FIM 認知の SHAP が正だから、FIM 認知を上げれば自宅退院確率が上がる」とは直ちに言えない、という点はリハ研究で頻出する誤読です。
→ 詳細はこちら:第10部 説明可能AI(公開予定)
// 08 · READS初学者が読むべき記事一覧
「リハビリ × 機械学習」を、ここから順に読み進めれば全体像を掴めます。各記事は単独でも読めますが、流れに沿って読むと理解が深まります。
医療者のための機械学習入門
— 重回帰の限界と非線形データ
機械学習の最初の一冊。リハ研究で「機械学習が必要になる」場面を、臨床の言葉で説明。
統計モデル・機械学習・生成AIの違い
— 医療AI研究で「説明・予測・生成」をどう使い分けるか
3 つの違いを医療者向けに整理。自分の研究はどのアプローチが向くかを判断できる。
予測モデルとは何か
— 入院時情報から将来を推定する
リハ予後予測の基本概念。入院時データからどのように将来を推定するか。
ロジスティック回帰
— リハビリ予後予測の最重要モデル
自宅退院可否を題材に、シグモイド・オッズ比・係数の臨床解釈まで。
正則化(Lasso / Ridge / Elastic Net)
— 過学習・多重共線性への対処
リハ予後予測で変数が多いとき、過学習を構造的に防ぐ 3 手法と CV による λ 調整。
過学習を、グラフで体験する
— Interactive Overfitting Demo
多項式の次数・ノイズ・サンプル数を動かして、訓練と検証の誤差差分を観察。
さらに進みたい方は、第1部 医療AI・機械学習の基礎地図、第3部 医療AI・機械学習アルゴリズム図鑑 を順に読んでください。第9部「医療AI研究の落とし穴と対策」(公開予定)で論文化のときに躓きやすい落とし穴を、第10部「説明可能AI」(公開予定)でSHAP・LIME・Grad-CAMを扱います。
// 11 · FAQよくある質問
- リハビリ領域で機械学習を学ぶなら、どの記事から読むべきですか?
- まず本ガイドで全体像をつかみ、次に機械学習入門、予測モデルの基本、説明変数と目的変数、ロジスティック回帰の順に読むと理解しやすくなります。
- Pythonができないと医療AI研究は始められませんか?
- 最終的にはPythonやRがあると実装しやすいですが、最初は臨床疑問、目的変数、説明変数、評価指標、検証方法を設計できることが重要です。実装は小さなサンプルから段階的に学べます。
// CLOSING本サイトについて
Rehab AI Tech は、リハビリテーション科専門医・指導医であり医学博士・工学修士を有する運営者が、リハビリ領域の機械学習・医療AI を医療者・研究者のために体系化する専門サイトです。臨床と工学を一人の中で橋渡しできる立場から、「研究で本当に使える知識」と「AI の限界も含めた正確な情報」の両立を目指しています。