// PART 01全体像(5/5 完成)
リハビリAI・機械学習入門
— 医療者のための予後予測の基本
機械学習が注目される理由を、重回帰分析との対比で整理。FIM予後予測や歩行自立予測への応用イメージを掴みます。
統計モデル・機械学習・生成AIの違い
— リハビリ・医療AI研究で「説明・予測・生成」をどう使い分けるか
推定・予測・生成。3つの目的の違いを整理し、研究テーマに応じた手法選択の基準を示します。
回帰・分類・クラスタリング・生成の違い
— リハビリAI研究でタスクをどう見分けるか
機械学習の代表的な4タスク類型を、リハビリ研究の例で対応付けます。
リハビリAI研究の進め方
— 研究疑問から論文化までの7ステップ
研究疑問の立案からモデル展開、論文投稿まで。リハビリAI・機械学習研究の典型的な工程を一枚絵で示します。
予測モデルとは何か
— 入院時情報から将来の転帰を推定する考え方
説明変数と目的変数、回帰と分類、評価指標の前提。FIM予後予測や退院時歩行自立予測を例に基本を整理します。
// GUIDE最初に読むガイド(1/1 公開中)
// PART 02データを整える(7/7 公開中)
説明変数と目的変数
— リハビリAI研究のデータ設計
何を入力にして、何を予測するか。FIM予後予測や歩行自立予測を例に、リハビリAI研究の変数設計を整理します。
欠損値処理
— MCAR / MAR / MNAR と多重代入
FIMや認知機能検査の欠損を例に、MCAR / MAR / MNAR、多重代入、Pipeline内での安全な補完を整理します。
外れ値・カテゴリ変数・標準化
— 前処理の基本セット
FIM、歩行速度、施設IDを例に、IQR、One-Hot Encoding、標準化、RobustScalerを整理します。
特徴量エンジニアリング
— 臨床知識を変数に翻訳する
FIM利得率、BMI、累積訓練量、交互作用項など、臨床知識をリハビリAIの特徴量に変換します。
特徴量選択
— データと臨床知識で変数を絞る
Lasso、RFE、Boruta、VIF、EPVを、リーケージを避けるPipeline設計と一緒に整理します。
データリーケージを防ぐ前処理
— trainでfit、testはtransformのみ
ColumnTransformer と Pipeline で、補完・標準化・特徴量選択をtrain内でfitする実装パターン。
表形式データの実践Tips
— リハビリAI研究の前処理チェックリスト
データ受領後の確認、データ辞書、施設別分布、リーケージ点検、第2部全体を統合したPipelineの考え方。
// PART 03リハビリAI・機械学習アルゴリズム図鑑(15/15 公開中)
線形回帰
— 連続値予測の最小単位
退院時FIM予測を題材に、最小二乗法から決定係数・残差プロットまで。全アルゴリズムの基礎となる「重み付き和」の世界。
ロジスティック回帰
— リハビリ予後予測の最重要モデル
自宅退院可否を題材に、シグモイド関数・オッズ比・係数の臨床的解釈まで。リハビリAI研究で比較基準にしやすいアルゴリズム。
正則化(Lasso / Ridge / Elastic Net)
— 過学習・多重共線性への構造的対処
L1(Lasso)・L2(Ridge)・Elastic Net の幾何学的違いと使い分けを、リハ予後予測の例とCVによるλ調整つきで整理。
k近傍法(kNN)
— 似た症例から予測する距離ベースの機械学習
kの選び方・標準化・次元の呪い・KNNImputer まで、リハビリAI研究での類似症例検索の使い方を実装と一緒に整理。
ナイーブベイズ
— ベイズの定理から考える確率ベースの分類
ベイズの定理・条件付き独立仮定・GaussianNB / MultinomialNB / BernoulliNB の使い分け、テキスト分類と Calibration の注意点まで整理。
SVM(サポートベクターマシン)
— マージン最大化とカーネル
サポートベクター、C と γ、標準化、SVM の使いどころと限界を整理します。
決定木
— if-then で読める分岐モデル
Gini、エントロピー、max_depth、剪定を、リハビリAI研究での使いどころと一緒に整理します。
アンサンブル学習
— Bagging / Boosting / Stacking
複数モデルを組み合わせる考え方を、分散低減・バイアス低減・OOF 予測から整理します。
ランダムフォレスト
— Bagging の代表モデル
多数の決定木、特徴量サブセット、重要度の読み方、GroupKFoldでの確認を整理します。
勾配ブースティング
— XGBoost / LightGBM / CatBoost
表形式データの実用標準。early stopping、calibration、SHAP の読み方まで扱います。
異常検知
— Isolation Forest / One-Class SVM
正常からのずれを見つける教師なし手法と、閾値設定・レビュー体制を整理します。
ニューラルネットワーク基礎
— MLP / 活性化関数 / 損失関数
パーセプトロンから多層パーセプトロン、活性化関数、損失関数、過学習対策まで。
最適化アルゴリズム
— SGD / Adam / AdamW
学習率、Momentum、Adam、AdamW、スケジューラ、Early Stoppingを整理します。
次元削減
— PCA / t-SNE / UMAP
高次元データの可視化と前処理を、CV内PCAや可視化の読みすぎ問題まで含めて整理します。
クラスタリング
— k-means / 階層的 / DBSCAN / GMM
教師なしで群を探す手法と、クラスタ数の選び方、臨床サブタイプ解釈の注意点を整理します。
// PART 09医療AI研究の落とし穴と対策(11/11 公開中)
過学習と正則化
— 訓練データに合わせすぎないための医療AI研究入門
訓練データではよく当たるのに、未知の患者では性能が落ちる理由を、正則化・交差検証・外部検証とあわせて整理します。
データリーケージとは何か
— 未来の情報が紛れ込む瞬間
前処理・特徴量・分割の各段階で起きる「未来情報の漏れ」。検出と防止のチェックポイントをまとめます。
小規模データ問題(EPV・サンプルサイズ設計)
— 「N が少ない」だけでは語れない過大評価のメカニズム
EPV ≥ 10-20 の根拠、Methods で書く sample size justification、リハ研究での実数値の見方。
不均衡データ(SMOTE 批判と過剰リサンプリングの罠)
— 「accuracy が高い」「SMOTE で補正した」を冷静に読むために
転倒・在宅復帰など低頻度イベント予測で、SMOTE が逆に較正を壊す仕組みと、AUC/PR-AUC/calibration の選び方。
多重比較と過剰なモデル探索
— 探索しすぎた研究の帰結を、どこで止めるか
特徴量探索・モデル探索・ハイパラ探索を Methods にどう書くか。Nested CV の必要性。
欠測バイアス(MCAR/MAR/MNAR と医療AIの欠測処理)
— 「空欄」ではなく、患者状態と診療プロセスのサインとして読む
CC / Multiple Imputation / pattern submodels の使い分け、sensitivity 解析の組み方。
施設差・ドメインシフト
— ある施設で動くモデルが、他施設で落ちる理由
時間順 / 多施設 / 解像度違いの 3 種の外部検証、GroupKFold の Methods 記述。
ショートカット学習・スプリアス相関
— 医療AIが「本質」ではなく「それっぽい手がかり」を拾う問題
医療画像の background bias、テキストレポートの defaults、リハ動画の撮影環境差。
因果と予測の混同
— SHAP や重要度を「原因」「介入効果」と読まない
予測モデルの SHAP・feature importance を介入効果として誤読するパターンと、因果推論との境界。
公平性・バイアス
— 年齢・性別・施設で「誰に対して性能が低いか」を確認する
サブグループ別 AUC / calibration の出し方、Equalized Odds の最低限の理解、Methods での公平性記述。
査読者に突っ込まれる点
— 医療AI論文を投稿する前に、設計・解析・報告・解釈を点検する
Major comment 10 選を、Methods・Results・Discussion の節別に。投稿前 4 層チェック。
// PART 13研究プロセスに、生成AIを組み込む(6/6 公開中)
ChatGPT で医学論文を読む方法
— AI 要約 → 原典照合 → 批判的読解の 3 段階
PDF 添付、構造化要約、ハルシネーション抑制。リハビリAI論文を安全に読むための運用ルール。
英語論文を日本語で要約するプロンプト
— 300 字 / 1000 字 / 詳細解析の 3 テンプレ
Background / Methods / Results / Discussion を構造的に抽出。PICOS 抽出も。
査読コメントに返信するプロンプト
— Point-by-point とエビデンス補強
逐条返信の 4 ステップ、典型コメント 6 種への返信骨子、トーン調整、追加解析判定。
論文の Methods を書くプロンプト
— TRIPOD+AI 27 項目で再現できる Methods
9 サブセクション骨子生成、PROBAST+AI 自己点検、FIM/PUL/mRS 用語統一、ICMJE 2026 準拠の AI 利用開示。
Claude Code で Web アプリを作る方法
— FIM 予後予測ミニデモを段階構築
HTML+CSS+JS 3ファイル構成・架空データのみ・6フェーズワークフローで研究教材を作る。
生成 AI 使用時の個人情報保護
— 迷ったら入れない、仮名化と匿名化を混同しない
仮名化と匿名化の違い、再同定リスク、クラウドAIとローカルLLMのリスク差を整理。
// PART 14触って学ぶデモ(4/8 公開中)
過学習を、グラフで体験する
— Interactive Overfitting Demo
多項式回帰の次数・ノイズ・サンプル数を操作して、訓練誤差とテスト誤差の挙動を体感する。U字に膨らむテスト誤差を実際に動かして観察。
交差検証を、foldの入れ替わりで体験する
— k-fold CV Demo
fold数、モデル複雑さ、症例数を変えて、CV誤差の振る舞いを体感できます。
データリーケージを、グラフで体験する
— Leakage Demo
リーケージ情報の強さで AUC / Accuracy が不自然に上がる様子を確認できます。
Decision Curve Analysisを、グラフで体験する
— DCA Demo
しきい値確率を動かしながら、Net Benefit と臨床的有用性を直感的に学べます。
// UPCOMING近日公開予定
第13部「研究プロセスに、生成AIを組み込む」は全 6 記事を公開済みです。第14部「触って学ぶデモ」残り 4 デモは順次公開予定です。最新のリリース予定は カテゴリ一覧 をご覧ください。