跳转到内容

0.1 30 分钟 AI 工程体验

30 分钟 AI 快速体验闭环

**先感受闭环:**输入 -> 模型 -> 输出 -> 检查。现在不用背术语。

面向就业/转型时,第一个习惯不是“被 AI 震撼”,而是改一个条件、比较输出,并记录别人也能检查的证据。

打开你能访问的任意 AI 聊天或图像工具,输入:

用一个比喻给新手解释 RAG。

再把“新手”改成“开发者”,比较两次输出有什么不同。目标不是判断 AI 聪不聪明,而是观察一个小小的输入变化,怎样改变结构、用词、例子和自信程度。

改什么看什么
读者:新手 -> 开发者例子和词汇有没有变化
约束:加上80 字以内模型是否遵守长度和重点
格式:加上给 3 条要点输出是否更容易扫读
证据:加上包含一个局限它是否说明答案不能保证什么

这个小比较,是整门课的第一个习惯:不要只看一次输出。改一个条件、做比较、留下更好的结果,并写清楚它为什么更好。

打开 Google Colab,新建 Notebook,运行:

!pip install transformers torch pillow requests -q
from transformers import pipeline
from PIL import Image
import io
import requests
classifier = pipeline(
"image-classification",
model="google/vit-base-patch16-224",
use_fast=True,
)
image_url = "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/cats.png"
response = requests.get(image_url, headers={"User-Agent": "Mozilla/5.0"}, timeout=20)
response.raise_for_status()
content_type = response.headers.get("Content-Type", "")
if "image" not in content_type:
raise ValueError(f"Expected an image response, got {content_type}: {response.text[:120]}")
image = Image.open(io.BytesIO(response.content)).convert("RGB")
for row in classifier(image)[:3]:
print(f"{row['label']:30s} {row['score']:.1%}")

预期形状:

tabby, tabby cat 27.4%
tiger cat 27.2%
Egyptian cat 14.0%

你的数字可能不同。重要的是输出形状:按分数排序的标签列表。 这里先检查 HTTP 状态和 Content-Type。如果 URL 返回 HTML 或错误页,会给出清楚提示,而不是 PIL 的 UnidentifiedImageError

新人问题实用回答更深一层信号
输入是什么一个来自 URL 的图片真实系统要检查文件类型、大小、来源和隐私
模型是什么一个预训练图像分类器它只认识训练设定里的标签
输出是什么前几名标签和分数高分不是事实证明,只是模型置信度
会在哪里失败下载、安装或模型加载可能失败可靠 AI 工作需要日志、备用路径和可复现环境

如果 Colab 失败,不要花一整天卡在这里。保存报错信息,先完成无代码体验,学完第 1 章的终端、Python 和环境后再回来。

新建一条短笔记,写五行:

产物名称:
试过的输入:
观察到的输出:
控制变量:
证据价值:

这里的 AI 不神秘:你给输入,训练好的模型处理它,你检查输出。有经验的学习者还要注意隐藏的工程工作:依赖安装耗时、模型下载、输入验证、模型边界、输出格式,以及证据怎样被记录。下一步去准备最小环境。

学完这一页,至少保留这张证据卡:

迷你应用
完成的最小可运行 AI 或自动化演示
输入输出
样本输入、打印输出、截图或日志
对比记录
一个输入变化,以及它造成的输出差异
概念链接
后面哪一章解释隐藏机制
失败检查
API key、依赖、网络、Prompt 或输出格式问题
期望产出
一条很小但可检查的 AI 行为记录