医療者が最初に学ぶべき機械学習の内容は何ですか？

まず、予測したいアウトカム、説明変数と目的変数、回帰と分類、評価指標、過学習を押さえることが重要です。数式よりも、臨床の問いを機械学習の課題に翻訳する力を先に身につけると理解しやすくなります。

リハビリ研究で機械学習はどこから使い始めるとよいですか？

FIM利得、歩行自立、自宅退院可否など、臨床的に意味が明確な予後予測から始めるのがおすすめです。最初はロジスティック回帰や線形回帰をベースラインにして、評価指標と検証方法を丁寧に確認します。

リハビリAI・機械学習入門｜医療者のための予後予測の基本

回復期リハビリテーション病棟では、入院時の情報から退院時ADLや歩行自立を見通す場面が多くあります。退院先の相談、患者・家族への説明、リハビリ計画を考えるうえで、予後予測は重要な材料になります。これまでは臨床経験や統計解析をもとに判断されてきましたが、近年はAI・機械学習を使った予測モデルも研究されています。

機械学習の強みは、FIM、年齢、麻痺の重症度、画像、センサーデータのような複数の情報から、非線形な関係や変数同士の組み合わせを学習できる点です。ただし、機械学習を使えば必ず良くなるわけではありません。リハビリAI研究で使うには、何を予測するのか、どの時点の情報を使うのか、未知の患者でも性能が保たれるのかを確認する必要があります。

// CONTEXT

本サイトでは、機械学習を診断や治療方針を直接決めるためのものではなく、教育・研究・臨床的な仮説整理を支援する道具として扱います。本稿は 第1部リハビリAI・機械学習の基礎地図 の起点で、後続記事「統計モデル・機械学習・生成AIの違い」「回帰・分類・クラスタリング・生成の違い」と合わせて、サイト全体の前提語彙を揃える構成です。

// 01 · LEARN OUTCOMESこの記事でわかること

読了後、あなたは次の3つを医療者の語彙で説明できるようになります。

医療者が機械学習を理解するときの基本的な見取り図を持てる
重回帰分析と機械学習の違い、とくに非線形データへの対応の差を説明できる
FIM予後予測や歩行自立予測にどう応用できるかをイメージできる

// 02 · CONCLUSIONまず結論

// 03 · FIGURE直感的な図解

医療データでは、説明変数とアウトカムの関係が必ずしも直線的とは限りません。重回帰分析は直線で当てはめようとし、機械学習の多くは曲線で当てはめようとします。

Fig.1 線形モデル（破線）は直線で当てはめるため、非線形なデータの構造を捉えきれない。多くの機械学習モデルは非線形な関係を扱える。

// 04 · CLINICAL医療・リハビリでの具体例

リハビリテーション領域では、機械学習が予後予測や動作解析に応用されています。代表的な3つの応用先を整理します。

退院時予後予測（回帰）

入院時FIM、年齢、麻痺の重症度などを用いて、退院時FIMを予測する研究が報告されています。退院時FIM総得点のような連続値を予測する場合は「回帰」モデルが使われます。

退院時歩行自立予測（分類）

脳卒中リハビリでは、退院時に歩行が自立するかどうかは、患者説明やリハビリ計画を立てる上で重要です。自立か非自立かといったYes / No の二値分類の場合には、機械学習の分類モデルが使われることが多いです。

画像・センサーデータの解析（深層学習）

機械学習は、表形式の臨床データだけでなく、画像、動画、加速度計、歩行解析データにも応用されます。厳密には、機械学習を発展させた深層学習が使われることが多く、頭部CT画像、歩行中の加速度、関節角度の時系列データなどは、従来の表形式データよりも情報量が多く、深層学習と相性のよい領域です。

Fig.2 機械学習は臨床データだけでなく、画像やセンサーデータを含めた多様な情報を扱える。

// 臨床での読み替え

「予測したいアウトカム」が連続値（FIM得点など）なら回帰、Yes / No や3カテゴリ以上なら分類。データが画像や時系列なら深層学習を検討する。

// 05 · THEORY数式・理論

機械学習の3要素

機械学習は、学習データから予測モデルを確立し、新しいデータに対して予測や分類を行う方法です。医療研究で使う場合は、「入力＝説明変数」と「出力＝目的変数」を考えると理解しやすくなります。

たとえば、退院時歩行自立を予測する場合：

入力（説明変数）：年齢、発症後期間、入院時FIM、麻痺の重症度、認知機能
出力（目的変数）：退院時に歩行自立しているかどうか（Yes / No）

このとき、モデルは「年齢が低いほどよい」「入院時FIMが高いほどよい」といった単純な関係だけを見ているわけではありません。モデルによっては、複数の変数の組み合わせや、直線では表せない関係を捉えようとします。

重回帰分析との違い

重回帰分析は、複数の説明変数から目的変数を予測する代表的な統計手法です。形式的には次のように書けます。

y = β₀ + β₁·x₁ + β₂·x₂ + … + βₙ·xₙ + ε     ← 重回帰分析（線形モデル）

ŷ = f(x; θ)                                 ← 機械学習（一般形、f は非線形可）

重回帰分析は、説明変数と目的変数の関係を直線的に捉える形になりやすい方法です。交互作用項や変換項を加えることで複雑な関係を表すこともできますが、その設計は研究者があらかじめ考える必要があります。

機械学習モデルの一部、たとえば決定木系モデルや勾配ブースティング、ニューラルネットワークなどは、非線形な関係や変数同士の相互作用を比較的柔軟に扱えます。これが、医療AI研究で機械学習が注目される理由の一つです。

研究目的による使い分け

研究の目的が「関係をわかりやすく説明すること」なのか、「予測性能を高めること」なのかによって、適した方法は変わります。両者の特徴を整理すると次のようになります。

観点	従来の統計モデル	機械学習モデル
強み	解釈しやすい・論文で説明しやすい	非線形対応・多様なデータ対応
適性	仮説検証	予測性能の向上
注意点	非線形を前提できない	ブラックボックス化問題

医療AI研究では、統計モデルと機械学習モデルそれぞれの強みを理解して、研究の問いに応じて使い分けることが必要です。

// 07 · MYTHSよくある誤解

機械学習は古典的統計解析より常に優れている: 機械学習で予測精度が上がることはありますが、ブラックボックス問題により予測モデルの解釈が困難になりがちです。症例数やデータの偏りなどにより、重回帰分析やロジスティック回帰の方が適している場面も多くあります。
AIを使えば臨床判断を自動化できる: 医療AIの予測結果は、臨床判断を補助する情報の一つ。個別の診断や治療方針を直接決めることはできない。
データを入れれば自動的に意味のある結果が出る: 機械学習を実行すれば何らかの予測モデルは作れますが、それが臨床的に意味を持つかは別問題です。臨床的な問いが曖昧なままでは、結果の解釈も曖昧になります。

// 09 · CHECKLISTチェックリスト

本稿の語彙で研究計画・読書のセルフチェックに使う6項目。

01機械学習で何を予測したいのかを一文で説明できる
02目的変数と説明変数を区別できる
03回帰と分類の違いを説明できる
04重回帰分析と機械学習の違いを大まかに理解している
05機械学習が非線形な関係を扱える場合があることを理解している
06AIの予測結果を、臨床判断そのものとして扱わない

// 10 · QUIZミニクイズ

Q1機械学習モデルの一部が、重回帰分析と比べて得意としやすいものはどれでしょうか。
- すべての研究で因果関係を証明すること
- 非線形な関係や変数同士の複雑な組み合わせを扱うこと
- 少数例でも必ず高精度な結果を出すこと
- 医師の判断を完全に置き換えること
SHOW ANSWER

B. 機械学習モデルの一部は、非線形な関係や変数間の相互作用を柔軟に扱いやすい特徴があります。ただし、それは因果関係の証明や臨床判断の自動化を意味するものではありません。

// 11 · FAQよくある質問

医療者が最初に学ぶべき機械学習の内容は何ですか？: まず、予測したいアウトカム、説明変数と目的変数、回帰と分類、評価指標、過学習を押さえることが重要です。数式よりも、臨床の問いを機械学習の課題に翻訳する力を先に身につけると理解しやすくなります。
リハビリ研究で機械学習はどこから使い始めるとよいですか？: FIM利得、歩行自立、自宅退院可否など、臨床的に意味が明確な予後予測から始めるのがおすすめです。最初はロジスティック回帰や線形回帰をベースラインにして、評価指標と検証方法を丁寧に確認します。

// 01 · LEARN OUTCOMESこの記事でわかること

// 02 · CONCLUSIONまず結論

// 03 · FIGURE直感的な図解

// 04 · CLINICAL医療・リハビリでの具体例

退院時予後予測（回帰）

退院時歩行自立予測（分類）

画像・センサーデータの解析（深層学習）

// 05 · THEORY数式・理論

機械学習の3要素

重回帰分析との違い

研究目的による使い分け

// 07 · MYTHSよくある誤解

// 09 · CHECKLISTチェックリスト

// 10 · QUIZミニクイズ

// 11 · FAQよくある質問

// 12 · RELATED関連記事

統計モデル・機械学習・生成AIの違い— リハビリ・医療AI研究で「説明・予測・生成」をどう使い分けるか

回帰・分類・クラスタリング・生成の違い— リハビリAI研究でタスクをどう見分けるか

説明変数と目的変数— リハビリAI研究のデータ設計

統計モデル・機械学習・生成AIの違い
— リハビリ・医療AI研究で「説明・予測・生成」をどう使い分けるか

回帰・分類・クラスタリング・生成の違い
— リハビリAI研究でタスクをどう見分けるか

説明変数と目的変数
— リハビリAI研究のデータ設計