コンテンツにスキップ

5.0 学習ガイドとタスクリスト:機械学習

機械学習学習ガイドのプロジェクトループ

主な学習ルートは 第 5 章の入口 にまとめました。このページは、練習中に見る短いチェックリストとして使います。

タスクを定義するデータを分けるbaseline を学習する評価するエラーを見る改善する

どのモデルを使うか迷ったら、まず baseline から始めます。

このページを終えたら、この evidence card を残します。

モデリングループ
data、features、model、metric、エラー समीक्षा、次の実験
成果物
code、score、chart、pipeline、または project README
失敗確認
リーク、指標不一致、不安定な分割、過学習、または不明確なビジネス目標
次の行動
多数のパラメータ変更ではなく、1つの制御された実験を行う
期待される成果
深層学習に備えた再現可能なML証拠
チェック証拠
タスクの種類を定義できる問題メモ
リークなしでデータを分割できるtrain/test 分割メモ
dummy baseline と実モデルを学習できるbaseline 比較
タスクに合う指標を選べる指標メモ
エラーサンプルを確認できるエラー記録
証拠パックワークショップを完了できるml_workshop_run/
確認の考え方と解説
  1. 問題メモでは、回帰、分類、クラスタリング、評価、特徴量エンジニアリングのどれか、そして成功条件を書きます。
  2. 安全な分割メモでは、いつデータを分けたか、どの前処理を訓練データだけで fit したかを説明します。
  3. baseline 比較には、dummy または単純モデルと、より強いモデルを同じ評価方法で入れます。
  4. 指標メモでは、タスク目標からなぜその指標を選んだかを説明します。不均衡分類では accuracy だけでは不十分です。
  5. エラーサンプルは、単なるスクリーンショットではなく次の行動に変えます。良い次の行動は、特徴量、データ、しきい値、モデルの制御された変更です。
  6. 他の人が evidence pack を再実行し、モデリング判断を理解できるなら、第 6 章へ進めます。
成果物答えるべきこと
問題メモタスク種類は何で、成功とは何か。
分割メモテストデータを学習からどう隔離したか。
baseline 比較超えるべき最低スコアはいくつか。
指標メモなぜこの指標が単純な accuracy より目的に合うか。
エラー記録どのミスが最重要で、どの特徴量やラベルの問題がありそうか。

1 つの表形式プロジェクトに baseline、実モデル、指標、エラー分析、他の人が再実行できる README があれば、第 6 章へ進めます。