医療現場では、「予測」が多くの判断で重要な情報になります。例えば回復期リハビリテーション病棟であれば、入院時の情報から退院時のADLや歩行自立を予測することが、退院先の決定や患者・家族への説明で重要な情報となります。こうした予測は、これまで臨床経験や従来の統計解析をもとに行われてきました。
機械学習は、医療者の判断に重要な予測の精度を改善する可能性があり、現在注目されています。古典的な重回帰分析は線形データを仮定するため、医療データのような非線形データでは予測精度が低下することが知られています。一方で、機械学習は非線形データを予測するように設計されているため、重回帰分析よりも予測精度を改善する可能性があり、退院時ADL予測などの分野で注目されています。
本サイトでは、機械学習を診断や治療方針を直接決めるためのものではなく、教育・研究・臨床的な仮説整理を支援する道具として扱います。本稿は 第1部 医療AI・機械学習の基礎地図 の起点で、後続記事「統計モデル・機械学習・生成AIの違い」「回帰・分類・クラスタリング・生成の違い」と合わせて、サイト全体の前提語彙を揃える構成です。
// 01 · LEARN OUTCOMESこの記事でわかること
読了後、あなたは次の3つを医療者の語彙で説明できるようになります。
- 医療者が機械学習を理解するときの基本的な見取り図を持てる
- 重回帰分析と機械学習の違い、とくに非線形データへの対応の差を説明できる
- FIM予後予測や歩行自立予測にどう応用できるかをイメージできる
// 02 · CONCLUSIONまず結論
// 03 · FIGURE直感的な図解
医療データでは、説明変数とアウトカムの関係が必ずしも直線的とは限りません。重回帰分析は直線で当てはめようとし、機械学習の多くは曲線で当てはめようとします。
// 04 · CLINICAL医療・リハビリでの具体例
リハビリテーション領域では、機械学習が予後予測や動作解析に応用されています。代表的な3つの応用先を整理します。
退院時予後予測(回帰)
入院時FIM、年齢、麻痺の重症度などを用いて、退院時FIMを予測する研究が報告されています。退院時FIM総得点のような連続値を予測する場合は「回帰」モデルが使われます。
退院時歩行自立予測(分類)
脳卒中リハビリでは、退院時に歩行が自立するかどうかは、患者説明やリハビリ計画を立てる上で重要です。自立か非自立かといったYes / No の二値分類の場合には、機械学習の分類モデルが使われることが多いです。
画像・センサーデータの解析(深層学習)
機械学習は、表形式の臨床データだけでなく、画像、動画、加速度計、歩行解析データにも応用されます。厳密には、機械学習を発展させた深層学習が使われることが多く、頭部CT画像、歩行中の加速度、関節角度の時系列データなどは、従来の表形式データよりも情報量が多く、深層学習と相性のよい領域です。
「予測したいアウトカム」が連続値(FIM得点など)なら回帰、Yes / No や3カテゴリ以上なら分類。データが画像や時系列なら深層学習を検討する。
// 05 · THEORY数式・理論
機械学習の3要素
機械学習は、学習データから予測モデルを確立し、新しいデータに対して予測や分類を行う方法です。医療研究で使う場合は、「入力=説明変数」と「出力=目的変数」を考えると理解しやすくなります。
たとえば、退院時歩行自立を予測する場合:
- 入力(説明変数):年齢、発症後期間、入院時FIM、麻痺の重症度、認知機能
- 出力(目的変数):退院時に歩行自立しているかどうか(Yes / No)
このとき、モデルは「年齢が低いほどよい」「入院時FIMが高いほどよい」といった単純な関係だけを見ているわけではありません。モデルによっては、複数の変数の組み合わせや、直線では表せない関係を捉えようとします。
重回帰分析との違い
重回帰分析は、複数の説明変数から目的変数を予測する代表的な統計手法です。形式的には次のように書けます。
y = β₀ + β₁·x₁ + β₂·x₂ + … + βₙ·xₙ + ε ← 重回帰分析(線形モデル)
ŷ = f(x; θ) ← 機械学習(一般形、f は非線形可)
重回帰分析は、説明変数と目的変数の関係を直線的に捉える形になりやすい方法です。交互作用項や変換項を加えることで複雑な関係を表すこともできますが、その設計は研究者があらかじめ考える必要があります。
機械学習モデルの一部、たとえば決定木系モデルや勾配ブースティング、ニューラルネットワークなどは、非線形な関係や変数同士の相互作用を比較的柔軟に扱えます。これが、医療AI研究で機械学習が注目される理由の一つです。
研究目的による使い分け
研究の目的が「関係をわかりやすく説明すること」なのか、「予測性能を高めること」なのかによって、適した方法は変わります。両者の特徴を整理すると次のようになります。
| 観点 | 従来の統計モデル | 機械学習モデル |
|---|---|---|
| 強み | 解釈しやすい・論文で説明しやすい | 非線形対応・多様なデータ対応 |
| 適性 | 仮説検証 | 予測性能の向上 |
| 注意点 | 非線形を前提できない | ブラックボックス化問題 |
医療AI研究では、統計モデルと機械学習モデルそれぞれの強みを理解して、研究の問いに応じて使い分けることが必要です。
// 07 · MYTHSよくある誤解
- 機械学習は古典的統計解析より常に優れている
- 多くの機械学習は予測精度が高い一方で、ブラックボックス問題により予測モデルの解釈が困難になりがち。症例数やデータの偏りなどにより、重回帰分析やロジスティック回帰の方が適している場面も多い。
- AIを使えば臨床判断を自動化できる
- 医療AIの予測結果は、臨床判断を補助する情報の一つ。個別の診断や治療方針を直接決めることはできない。
- データを入れれば自動的に意味のある結果が出る
- 機械学習はプログラムなので、何かしらの予測モデルは確立される。しかし、それが臨床的に意味を持つかは別問題。臨床的な問いが曖昧なままでは、結果の解釈も曖昧になる。
// 09 · CHECKLISTチェックリスト
本稿の語彙で研究計画・読書のセルフチェックに使う6項目。
- 01機械学習で何を予測したいのかを一文で説明できる
- 02目的変数と説明変数を区別できる
- 03回帰と分類の違いを説明できる
- 04重回帰分析と機械学習の違いを大まかに理解している
- 05機械学習が非線形な関係を扱える場合があることを理解している
- 06AIの予測結果を、臨床判断そのものとして扱わない
// 10 · QUIZミニクイズ
-
Q1機械学習モデルの一部が、重回帰分析と比べて得意としやすいものはどれでしょうか。
- すべての研究で因果関係を証明すること
- 非線形な関係や変数同士の複雑な組み合わせを扱うこと
- 少数例でも必ず高精度な結果を出すこと
- 医師の判断を完全に置き換えること
SHOW ANSWER
B. 機械学習モデルの一部は、非線形な関係や変数間の相互作用を柔軟に扱いやすい特徴があります。ただし、それは因果関係の証明や臨床判断の自動化を意味するものではありません。