コンテンツにスキップ

0.5 キャップストーンプロジェクト軸:コース知識アシスタント

プロジェクト視点マップ

自分のプロジェクトがまだない場合は、コース知識アシスタントを標準プロジェクトにしてください。これは追加課題ではありません。各章で1つずつ能力を足し、最終的に説明でき、再実行でき、評価でき、配置できる AI アプリケーションへ育てるポートフォリオ軸です。

最終的に、このプロジェクトは次を満たします。

  • コースノート、PDF、Web 抜粋、または自分の学習記録を読み込める。
  • source、time、fields、quality notes を残しながらデータを整備できる。
  • Prompt、RAG、Agent ワークフローで回答し、検索 trace と tool trace を保存できる。
  • 固定評価質問、失敗サンプル、コスト/遅延メモ、安全境界を持つ。
  • 必要に応じて画像、OCR、マルチモーダル素材、ローカルのオープンソースモデル実行環境を接続できる。
  • レビューする人が README から中核経路を再実行できる。
capstone-course-assistant/
README.md
data/
raw/
processed/
notebooks/
src/
cli.py
data_pipeline.py
evals.py
rag.py
agent_tools.py
reports/
evidence_log.md
failure_cases.md
eval_results.csv
runtime_notes.md

初日はフォルダと README だけで十分です。他のファイルは、章が進むにつれて自然に増えます。

ポートフォリオ提出テンプレート

Section titled “ポートフォリオ提出テンプレート”

各大きな段階の終わりに、同じ提出形式を使います。これにより、プロジェクトはデモの寄せ集めではなく、レビューできる成果物になります。

README.md 何をするか、どう実行するか、まだ支援しないこと
run.sh or commands.md 正確な再実行手順
data_note.md 出典、フィールド、整備ルール、プライバシーメモ
eval_cases.csv 比較に使う固定質問または入力
failure_cases.md 少なくとも1つの正直な失敗と推定原因
screenshots/ or outputs/ 見える結果、グラフ、トレース、API 応答
release_note.md この章で何が変わり、次に何をテストするか

最小版は README、1つの実行コマンド、1つの出力、1つの失敗メモです。強いポートフォリオ版では、固定評価セット、before/after 比較、コストまたは遅延メモ、安全境界、短いデモスクリプトまで含めます。

第1-3章:再現可能な作業台 環境コマンド、Git コミット、Python CLI、サンプルデータ、整備ルール、グラフ、データ品質メモを残します。

第4-6章:モデルの証拠 小さな分類、回帰、または表現学習実験で、baseline、指標、失敗サンプル、学習診断を練習します。高スコアではなく、証拠でモデルを判断することが目的です。

第7章:LLM の挙動制御 5-10 個の質問を固定し、Prompt、構造化出力、token/context 制限、失敗サンプルを比較します。任意で mini GPT-2 を動かし、学習と生成の経路を理解します。

第8章:RAG による根拠つき回答 コース資料を chunk に分け、metadata を付け、証拠を検索し、引用つき回答を生成します。最終回答を見る前に top-k chunk を保存します。

第9章:Agent ツールループ ファイル読み取り、フォルダ一覧、レポート生成など、少数の安全な tool だけを公開します。tool schema、trace、安全ブロック、rollback メモを残します。

第10-12章:プロダクト別の拡張 画像や OCR なら第10章、ラベル・抽出・要約なら第11章、PDF・画像・音声・動画・クリエイティブパッケージなら第12章を使います。

第13章:オープンソースモデル実行環境 小型モデルから始め、ローカル推論、評価、OpenAI 風 API を動かします。GPU があれば vLLM や SGLang を試します。モデルライセンス、環境レポート、初回実行、評価表、停止手順を残します。

各章の終わりに、次の4つへ答えます。

  • プロジェクトにどの能力が増えたか。
  • どのコマンドで再実行できるか。
  • どの証拠が動作を示すか。
  • どの失敗サンプルが主張を控えめにしてくれるか。

答えられない場合は、機能追加の前に証拠を足してください。

このページの学習結果を、プロジェクト軸の証拠カードとして保存します。

プロジェクト名
コース知識アシスタント、または自分の代替プロジェクト
章ごとの成長ルール
demo を積み上げるのではなく、各章で1つの能力を足す
再実行経路
README コマンド、script、notebook cell、または service endpoint
レビュー用パッケージ
data note、eval cases、trace、failure note、release note
期待される成果
setup から RAG、Agent、runtime evidence まで育つ1本のプロジェクト軸

メインルートを終えた後、このプロジェクトには少なくとも次が必要です。

  • 実行可能な README。
  • 小さなデータセットまたはドキュメントセット。
  • 固定評価質問。
  • Prompt/RAG/Agent trace。
  • 失敗ケースと改善計画。
  • クラウド API を使う時と、オープンソースモデル実行環境を使う時の説明。

目的は最大のシステムを作ることではありません。AI エンジニアリングのループを本当に理解していると、他の人が信じられるシステムを作ることです。

この planning page は、project thread に 1 つの rerun command、1 つの evaluation artifact、1 つの known failure case があれば合格です。