// PART 03 / 16 · 15 ARTICLES

MEDICAL-AI-ALGO REHAB L1 L2

医療AI・機械学習アルゴリズム図鑑

データを整えた後に考えるべきことは、「どのアルゴリズムを使うか」です。

機械学習のアルゴリズムには、それぞれ得意なデータ、苦手なデータ、解釈のしやすさ、必要な症例数があります。リハビリテーション研究では、最新の手法を使うことよりも、研究目的とデータの性質に合ったアルゴリズムを選ぶことが重要です。

第3部「医療AI・機械学習アルゴリズム図鑑」では、リハビリテーション研究で使われる代表的な機械学習アルゴリズムを 15 記事で整理します。線形回帰、ロジスティック回帰、正則化、SVM、決定木、ランダムフォレスト、勾配ブースティング、ニューラルネット、次元削減、クラスタリングなどを、仕組み・強み・弱み・適用場面の違いから解説します。

退院時 FIM 予測、歩行自立予測など、リハビリ領域の具体例を通して、「この研究ではどのアルゴリズムを選ぶべきか」を考えるための判断軸を身につけられるように解説します。

ARTICLES: 15
READING: ~2.5 h
LEVEL: L1–L2
UPDATED: 2026.05

なぜ「医療AI・機械学習アルゴリズム図鑑」が必要なのか

// 01 · INTRO

機械学習の入門書は、どれもアルゴリズムを並列に紹介します。「線形回帰、決定木、SVM、ニューラルネット…」というリスト形式。しかしこれでは、自分の研究テーマに対して「どれを選ぶべきか」を判断できません。本パートは、各アルゴリズムを強み・弱み・適用場面・対立する選択肢の対比で記述することで、リハ研究者が「研究目的から逆算してアルゴリズムを選ぶ」判断軸を養います。

実務では、アルゴリズムを「線形 / 距離・確率 / 木・アンサンブル / 教師なし / ニューラル」の5系統に分類して把握すると、初見のアルゴリズムでも「どの系統に近いか」で大体の特性が予想できます。本パートはこの分類軸を提供します。

// CONTEXT

本パートは 第1部医療AI・機械学習の基礎地図(タスク類型)と 第2部医療AI・機械学習のための臨床データ前処理 を前提とします。データを整えた後の「では何で学習させるか」に答える本丸です。第4部「深層学習」は本パート 03·12〜13 の続編です。

5系統で把握する

// 02 · LINEAGES

15のアルゴリズムを、「物事の見方」の違いで5系統に分けると次のようになります。

// LINEAGE 1 / 線形系(03·01–03)

「重み付き和」で予測する系統。線形回帰・ロジスティック回帰・正則化(Lasso/Ridge/Elastic Net)。係数の解釈が直接できるので臨床研究で頻用。リハ研究の予後予測モデルの王道。

// LINEAGE 2 / 距離・確率・カーネル系(03·04–06)

「類似度」「条件付き確率」「サポートベクター」で予測する系統。k近傍法・ナイーブベイズ・SVM。直感的・小サンプルで強力・モデルがコンパクト。標準化が必須のものが多い。

// LINEAGE 3 / 木・アンサンブル系(03·07–10)

「閾値の連鎖」と「複数モデルの統合」で予測する系統。決定木・アンサンブル(Bagging/Boosting/Stacking)・ランダムフォレスト・勾配ブースティング。表形式データで最も実用的。標準化が不要。

// LINEAGE 4 / 教師なし系(03·11, 03·14–15)

「データの構造」を見つける系統。異常検知・次元削減・クラスタリング。仮説生成・可視化・データ理解に有効。リハ研究では回復パターンの類型化や外れ値検知に使う。

// LINEAGE 5 / ニューラルネット系(03·12–13)

「層を重ねた変換」と「勾配で学ぶ最適化」で予測する系統。ニューラルネット基礎・最適化アルゴリズム。表形式データでは木系に劣るが、画像・動画・時系列で圧倒的。歩行解析・医用画像で必須。第4部の前提知識。

記事一覧 — 15 articles

// 03 · ARTICLES

03·018 min

MEDICAL-AI-ALGOL1

線形回帰
— 連続値予測の最小単位

退院時FIM予測を題材に、最小二乗法から決定係数・残差プロットまで。全アルゴリズムの基礎となる「重み付き和」の世界。

// algorithm / linearREAD →

03·0210 min

MEDICAL-AI-ALGOREHABL1

ロジスティック回帰
— リハビリ予後予測の最重要モデル

自宅退院可否を題材に、シグモイド関数・オッズ比・係数の臨床的解釈まで。リハ研究で最も登場するアルゴリズム。

// algorithm / classificationREAD →

03·039 min

MEDICAL-AI-ALGOL2

正則化(Lasso / Ridge / Elastic Net)
— 過学習を防ぐ3つの手法

L1は変数選択、L2は係数縮小、Elastic Netは両方。サンプル数が変数数を上回らないリハ研究の救世主。

// algorithm / regularizationREAD →

03·047 min

MEDICAL-AI-ALGOL1

k近傍法(kNN)
— 類似症例ベースの予測

「似た過去症例の結果から予測」する直感的なアルゴリズム。距離計算と次元の呪い、リハ研究での適用範囲。

// algorithm / distanceREAD →

03·057 min

MEDICAL-AI-ALGOL2

ナイーブベイズ
— 条件付き確率による分類

ベイズの定理 + 「特徴量間の独立」仮定。実装が単純で高速、テキスト分類や医療記録のスクリーニングで実用的。

// algorithm / probabilisticREAD →

03·069 min

MEDICAL-AI-ALGOL2

SVM(サポートベクターマシン)
— 高次元での線形分離

最大マージン分類、カーネルトリック。小サンプル高次元の医用画像系でかつて主役だった手法。

// algorithm / kernelREAD →

03·077 min

MEDICAL-AI-ALGOL1

決定木
— 解釈可能なモデルの代表

if-then ルールの連鎖。Gini不純度と情報利得、過学習しやすい弱点と剪定。アンサンブル系の出発点。

// algorithm / treeREAD →

03·088 min

MEDICAL-AI-ALGOL2

アンサンブル学習
— Bagging / Boosting / Stacking

複数モデルを組み合わせて性能を上げる3戦略。ランダムフォレストと勾配ブースティングの理論的基盤。

// algorithm / ensembleREAD →

03·098 min

MEDICAL-AI-ALGOL2

ランダムフォレスト
— 平均化の力

複数の決定木を平均化して過学習を抑える。Bagging とランダム特徴量選択の組み合わせ。実務での「とりあえず最初に試す」枠。

// algorithm / ensembleREAD →

03·1011 min

MEDICAL-AI-ALGOREHABL2

勾配ブースティング
— XGBoost / LightGBM / CatBoost

表形式データで最も強力なアルゴリズム群。逐次的に弱い木を足していく仕組み、3手法の使い分け、ハイパーパラメータの実務調整。

// algorithm / boostingREAD →

03·118 min

MEDICAL-AI-ALGOL2

異常検知
— Isolation Forest / One-class SVM

「正常データから外れた症例」を検出する手法。歩行データの異常検知、データ品質チェックに有用。

// algorithm / anomalyREAD →

03·1212 min

MEDICAL-AI-ALGODLL2

ニューラルネット基礎
— 多層パーセプトロン

入力→隠れ層→出力の3層構造、活性化関数、誤差逆伝播。深層学習(第4部)への橋渡し。

// algorithm / nnREAD →

03·1310 min

MEDICAL-AI-ALGODLL2

最適化アルゴリズム
— SGD / Adam / AdamW

勾配降下法の派生3種。学習率の役割、Momentum、適応的学習率、weight decay の正しい扱い。深層学習の心臓部。

// algorithm / optimizationREAD →

03·149 min

MEDICAL-AI-ALGOL2

次元削減
— PCA / UMAP / t-SNE

線形(PCA)と非線形(UMAP/t-SNE)の対比。歩行波形・医用画像特徴量の可視化、ノイズ除去、前処理。

// algorithm / unsupervisedREAD →

03·159 min

MEDICAL-AI-ALGOL2

クラスタリング
— k-means / 階層的 / DBSCAN / GMM

球状クラスタの k-means、樹形図の階層的、密度ベースの DBSCAN、確率モデルの GMM。回復パターンの類型化に。

// algorithm / clusteringREAD →

読む順番(推奨パス)

// 04 · LEARNING_PATH

15記事は系統別に学ぶのが最も効率的です。目的別の最短経路もあります。

// 急いで予後予測モデルを作りたい人(40分)

03·02 → 03·03 → 03·09 → 03·10。ロジスティック回帰でベースライン → 正則化で過学習防止 → ランダムフォレスト → 勾配ブースティングで性能向上。これだけでリハ研究の予後予測モデル開発はカバーできる。

// 体系的に学びたい人(2.5時間)

系統順に 03·01〜15 を通読。線形系(01-03)→ 距離・確率・カーネル系(04-06)→ 木・アンサンブル系(07-10)→ 教師なし系(11, 14, 15)→ ニューラル系(12-13)。各系統の「物事の見方」が積み上がる。

// 深層学習に進みたい人(40分)

03·12 → 03·13 → 第4部。ニューラルネット基礎 → 最適化(SGD/Adam/AdamW)→ 第4部 CNN/Transformer。第4部の前提知識として必須の2記事を集中的に。

// 結果の解釈を重視する人(50分)

03·02 → 03·03 → 03·07 → 03·10 → 第10部 XAI。ロジスティック回帰の係数 → 正則化で変数選択 → 決定木の if-then ルール → 勾配ブースティング+SHAP。解釈可能性に強い系統を辿る。

前提として読むと良い章

// 05 · PREREQUISITES

01·016 min

OVERVIEWL1

医療者のための機械学習入門
— 臨床者の語彙で読む、最小限の機械学習

features / label / loss / generalization の4語を、本パートでは前提語彙として使います。

// prerequisite · 01READ →

01·037 min

OVERVIEWL1

回帰・分類・クラスタリング・生成の違い
— 医療AI研究でタスクをどう見分けるか

タスク類型を把握すると、各アルゴリズムが何タスクに適するか即座に判断できます。

// prerequisite · 02READ →

02·--7 articles

DATA-PREPL1-L2

第2部医療AI・機械学習のための臨床データ前処理
— 前処理の全工程

アルゴリズムを学ぶ前に、データを正しく整えること。本パートは整えたデータが前提。

// prerequisite · 03READ →

編者ノート

// 06 · EDITORS_NOTE

私が研究を始めた頃、アルゴリズムの選択は「最新で強力なものを使う」という基準でした。「ランダムフォレストが流行っているから RF」「いまは勾配ブースティングの時代」「いやいや深層学習でしょ」── でも、実は逆で、研究目的に対して最も適したアルゴリズムを選ぶことが、性能・解釈性・査読の通りやすさのすべてを左右します。

リハ研究の文脈で言えば、サンプル数が 200 例程度の予後予測なら、ロジスティック回帰 + 正則化が依然として最強です。勾配ブースティングで同じデータを訓練しても、外部検証ではほとんど差が出ません。一方、ウェアラブルから何百万行のセンサーデータを扱うなら、線形モデルは無力で、LightGBM や深層学習が必須になります。

本パートは、「データの量と性質に応じてアルゴリズムを選ぶ」という実務感覚を養うことを目指します。15 記事を通読すると、「自分の研究にはこの系統」という嗅覚が身につくはずです。

特に 03·02 ロジスティック回帰、03·10 勾配ブースティング、03·12 ニューラルネット基礎 はリハ研究で最も登場するので、最初に読んでおくことを推奨します。

— Editor

医療AI・機械学習アルゴリズム図鑑

なぜ「医療AI・機械学習アルゴリズム図鑑」が必要なのか

5系統で把握する

記事一覧 — 15 articles

線形回帰— 連続値予測の最小単位

ロジスティック回帰— リハビリ予後予測の最重要モデル

正則化(Lasso / Ridge / Elastic Net)— 過学習を防ぐ3つの手法

k近傍法(kNN)— 類似症例ベースの予測

ナイーブベイズ— 条件付き確率による分類

SVM(サポートベクターマシン)— 高次元での線形分離

決定木— 解釈可能なモデルの代表

アンサンブル学習— Bagging / Boosting / Stacking

ランダムフォレスト— 平均化の力

勾配ブースティング— XGBoost / LightGBM / CatBoost

異常検知— Isolation Forest / One-class SVM

ニューラルネット基礎— 多層パーセプトロン

最適化アルゴリズム— SGD / Adam / AdamW

次元削減— PCA / UMAP / t-SNE

クラスタリング— k-means / 階層的 / DBSCAN / GMM

読む順番(推奨パス)

前提として読むと良い章

医療者のための機械学習入門— 臨床者の語彙で読む、最小限の機械学習

回帰・分類・クラスタリング・生成の違い— 医療AI研究でタスクをどう見分けるか

第2部 医療AI・機械学習のための臨床データ前処理— 前処理の全工程

編者ノート

線形回帰
— 連続値予測の最小単位

ロジスティック回帰
— リハビリ予後予測の最重要モデル

正則化(Lasso / Ridge / Elastic Net)
— 過学習を防ぐ3つの手法

k近傍法(kNN)
— 類似症例ベースの予測

ナイーブベイズ
— 条件付き確率による分類

SVM(サポートベクターマシン)
— 高次元での線形分離

決定木
— 解釈可能なモデルの代表

アンサンブル学習
— Bagging / Boosting / Stacking

ランダムフォレスト
— 平均化の力

勾配ブースティング
— XGBoost / LightGBM / CatBoost

異常検知
— Isolation Forest / One-class SVM

ニューラルネット基礎
— 多層パーセプトロン

最適化アルゴリズム
— SGD / Adam / AdamW

次元削減
— PCA / UMAP / t-SNE

クラスタリング
— k-means / 階層的 / DBSCAN / GMM

医療者のための機械学習入門
— 臨床者の語彙で読む、最小限の機械学習

回帰・分類・クラスタリング・生成の違い
— 医療AI研究でタスクをどう見分けるか

第2部医療AI・機械学習のための臨床データ前処理
— 前処理の全工程