コンテンツにスキップ

8.5.1 プロジェクトロードマップ:引用付き知識助手を作る

このキャップストーンは、知識、モデル呼び出し、アプリケーションフロー、engineering evidence を 1 つの再現可能な LLM アプリに接続できることを示します。

まずプロジェクト証拠ループを見る

Section titled “まずプロジェクト証拠ループを見る”

LLM アプリケーション総合プロジェクトのロードマップ

LLM アプリケーションプロジェクトの学習順序図

LLM アプリケーションプロジェクトのデリバリーループ図

プロジェクトは「ベクトルデータベースをつなぐ」だけではありません。文書、チャンク、検索、文脈、回答、引用、ログ、評価、改善をつなぐ追跡可能なループです。

プロジェクト準備チェックを動かす

Section titled “プロジェクト準備チェックを動かす”

プロジェクト完了前に、この checklist を使います。

project = {
"project_type": "knowledge-base assistant",
"documents": 5,
"eval_questions": 10,
"citations": True,
"empty_retrieval_handled": True,
"failure_cases": 3,
}
ready = (
project["documents"] >= 3
and project["eval_questions"] >= 10
and project["citations"]
and project["empty_retrieval_handled"]
and project["failure_cases"] >= 1
)
print("ready:", ready)
print("project_type:", project["project_type"])
print("evidence:", "docs, eval, citations, failures")

期待される出力:

Terminal window
ready: True
project_type: knowledge-base assistant
evidence: docs, eval, citations, failures

readyFalse なら、別の機能を足す前に evidence loop を完成させます。

手順プロジェクト本当に鍛える力
1企業またはコース知識ベース検索、権限、引用、追跡可能な回答
2知的アシスタント検索、セッション状態、ツール呼び出しをプロダクト機能にする
3RAG + 微調整システム知識不足と振る舞い不安定を分ける
4SOP 文書アシスタント文書解析、構造化出力、テンプレート描画
5フル実践ワークショップ実 API や DB を足す前の最小再現ループ

ガイド付き baseline が必要なら、8.5.6 実践:第 8 章 RAG アプリ完全ワークショップ から始めます。

このページを終えたら、この証拠カードを残します。

プロジェクト目標
ユーザーのタスクとビジネス境界
ベースライン
まずは最も簡単なプロンプト/RAG/app版
評価
固定ケース、検索証拠、回答品質、引用チェック
失敗ログ
少なくとも1件の失敗ケースと原因の可能性
成果物
README、実行コマンド、スクリーンショット/ログ、次の一手
成果物最低要件強いポートフォリオ版
README目的、実行コマンド、依存関係、例アーキテクチャ図、設計上のトレードオフ、コスト、振り返りを追加
知識ベースサンプル生文書、チャンク、メタデータ、出典フィールド権限ルール、文書バージョン、更新メモを追加
検索ログ命中箇所、スコア、順位失敗タイプ統計と前後比較を追加
回答引用最終回答が根拠ソースを表示引用の忠実性チェックを追加
失敗ケース少なくとも 1 件の失敗を記録3 件以上の原因、修正、regression check を追加
評価固定質問と合否ルールベースライン、メトリクス、回帰テストを追加
デプロイメモ実行方法と必要な環境変数Docker、監視、フォールバックメモを追加

引用付き回答、検索ログ表示、empty retrieval 処理、評価ケース保存、少なくとも 1 件の失敗説明ができれば、この章は合格です。

最強のポートフォリオ版は、最大の版ではありません。別の開発者が実行を再現し、証拠を確認し、次の改善方針を理解できる版です。

確認の考え方と解説
  1. 合格レベルの答えでは、query から chunks、retrieval scores、引用 evidence、answer、fallback behavior までの流れを追跡します。
  2. 証拠には、retrieved passages、source metadata、引用付き回答、空振りまたは誤検索の例を含めます。
  3. 失敗原因が chunking、retrieval、ranking、prompt assembly、source 不足、根拠のない生成のどれかを説明できればよいです。