3.0 学習ガイドとタスクリスト:データ分析と可視化

主な学習ルートは 第 3 章の入口 にまとめました。このページは、練習中に見る短いチェックリストとして使います。
一行モデル
読み込む -> 確認する -> 整える -> 集計する -> 可視化する -> 説明する
グラフを一文で説明できないなら、データの質問に戻ります。
練習チェックリスト
| チェック | 証拠 |
|---|---|
| 行、列、型、欠損値を確認できる | df.info() と欠損メモ |
| 重複、欠損、明らかな外れ値を処理できる | クリーニングログ |
groupby で質問に答えられる | 集計表 |
| 具体的な質問に合うグラフを選べる | 3 つのグラフファイル |
| 結論と限界を書ける | report.md |
| 再現可能なワークショップを完了できる | ch03_output/ |
証拠基準
| 成果物 | 答えるべきこと |
|---|---|
| データ辞書 | 各列は何を意味し、単位は何で、どこから来たか。 |
| クリーニングログ | どの行や値を変え、その規則がなぜ受け入れられるか。 |
| 集計表 | どの数値パターンが答えを支えているか。 |
| グラフ | この可視化は 1 つのどの問いに答えるか。 |
| 限界メモ | 欠損データ、サンプリング、時間、リークにより、まだ何が間違いうるか。 |
次へ進めるサイン
1 つの CSV を、元データからクリーニング済みデータ、集計表、グラフ、短い結論まで進められたら、第 4 章へ進めます。