コンテンツにスキップ

12.0 学習チェックリスト:AIGC とマルチモーダル

このページは印刷用チェックリストとして使います。詳しい説明が必要なときは、第 12 章入口ページ に戻ってください。

マルチモーダルポートフォリオ証拠パック

時間やることここまで言えたら止める
20 分入口ページのワークフローループを見る「マルチモーダル作業は出典を保った入力から始まる。」
25 分視覚記録スクリプトを動かす「視覚内容を確認可能な構造化記録にできる。」
25 分マルチモーダル基礎と画像生成をざっと読む「理解と生成には Prompt、model、output、review が必要。」
25 分倫理とコンプライアンスをざっと読む「外部利用には copyright、portrait、sensitive、factual checks が必要。」
25 分RAG/Agent ブリッジを読む「マルチモーダルは RAG、Agent、卒業プロジェクトを拡張する。」
証拠最小版
multimodal_pipeline.mdinput、parsing、generation/understanding、review、export
visual_records.jsonlsource、page/region/time reference、visible text、objects、uncertainty
prompts/Prompt 版、reference assets、negative requirements、selection notes
outputs/candidate outputs、selected output、rejected output、reason
safety_review.mdcopyright、portrait rights、sensitive content、factuality、usage boundary
README.mdgoal、run command、source materials、sample output、limitations
ゲート合格条件
Source traceすべての input/output が source、owner/license、version、必要なら page/region/time reference を保持している。
Prompt/versioncandidate outputs が Prompt、model/tool、reference assets、selection reason に結びついている。
Reviewcopyright、portrait/voice、sensitive content、factuality、accessibility、export scope が確認されている。
ExportREADME、manifest、selected outputs、rejected outputs、limits、next fix を他者が確認できる。
  • screenshot、PDF、image、audio、video の出典参照を保持できますか?
  • 非テキスト入力を RAG や Agent が使える構造化記録にできますか?
  • Prompt 版とレビュー記録で生成出力を比較できますか?
  • 外部公開前に何を確認すべきか説明できますか?
  • 結果を最終ポートフォリオまたは卒業デモとしてまとめられますか?

答えがすべて「はい」なら、マルチモーダル配信の道はできています。プロジェクトにオープンソースモデルのホスティング、ランタイム所有、ファインチューニング判断が必要になったら、第13章へ進みます。

確認の考え方と解説
  • 「できる」とは、各 non-text input に source、owner、version、review status があり、最終ファイルだけが残っている状態ではない、という意味です。
  • よい structured record には、抽出内容、modality metadata、confidence または review notes、source artifact へ戻る安定した link が含まれます。
  • 生成出力は、prompt versions、candidate ids、selected/rejected decisions、reviewer notes と結びつけます。そうすると iteration を説明できます。
  • 外部公開前には、factual grounding、consent and rights、privacy、sensitive content、safety policy、高リスク素材の human approval を確認します。
  • portfolio-ready な package には、brief、manifest、prompts、selected assets、rejected cases、review checklist、final export、workflow を説明する README が含まれます。
## 残す証拠

このページを終えたら、この evidence card を残します。

要約
ユーザーの目的、対象読者、素材、制約、出力形式
成果物
ソースファイル、プロンプト、生成候補、選択出力、却下版
レビュー
事実確認、著作権・肖像権・機微情報チェック、人の判断
統合
RAG レコード、Agent トレース、クリエイティブパッケージ、ストーリーボード、またはエクスポートプレビュー
期待される成果
README、レビュー用チェックリスト、失敗メモを含む再現可能なアセットパッケージ