メインコンテンツへスキップ

3.0 学習ガイドとタスクリスト:データ分析と可視化

データ分析学習ガイドの最小ループ

主な学習ルートは 第 3 章の入口 にまとめました。このページは、練習中に見る短いチェックリストとして使います。

一行モデル

読み込む -> 確認する -> 整える -> 集計する -> 可視化する -> 説明する

グラフを一文で説明できないなら、データの質問に戻ります。

練習チェックリスト

チェック証拠
行、列、型、欠損値を確認できるdf.info() と欠損メモ
重複、欠損、明らかな外れ値を処理できるクリーニングログ
groupby で質問に答えられる集計表
具体的な質問に合うグラフを選べる3 つのグラフファイル
結論と限界を書けるreport.md
再現可能なワークショップを完了できるch03_output/

証拠基準

成果物答えるべきこと
データ辞書各列は何を意味し、単位は何で、どこから来たか。
クリーニングログどの行や値を変え、その規則がなぜ受け入れられるか。
集計表どの数値パターンが答えを支えているか。
グラフこの可視化は 1 つのどの問いに答えるか。
限界メモ欠損データ、サンプリング、時間、リークにより、まだ何が間違いうるか。

次へ進めるサイン

1 つの CSV を、元データからクリーニング済みデータ、集計表、グラフ、短い結論まで進められたら、第 4 章へ進めます。