整改版本:按Day01工程化标准重写|不是泛泛课程笔记
生成时间:2026-06-09 15:32
| 学习模块 | 视频 / 分P / 章节 | 建议观看重点 |
|---|---|---|
| 检索命中 | LangGraph教程:RAG实战Indexing、Retrieval、如何提升RAG质量。 | 重点看它如何支撑“RAG 20题评测集”,不要全刷,只按关键词定位。 |
| 答案准确 | LangGraph教程:RAG实战Indexing、Retrieval、如何提升RAG质量。 | 重点看它如何支撑“RAG 20题评测集”,不要全刷,只按关键词定位。 |
| 引用准确 | LangGraph教程:RAG实战Indexing、Retrieval、如何提升RAG质量。 | 重点看它如何支撑“RAG 20题评测集”,不要全刷,只按关键词定位。 |
| 拒答率 | LangGraph教程:RAG实战Indexing、Retrieval、如何提升RAG质量。 | 重点看它如何支撑“RAG 20题评测集”,不要全刷,只按关键词定位。 |
| 失败归因 | LangGraph教程:RAG实战Indexing、Retrieval、如何提升RAG质量。 | 重点看它如何支撑“RAG 20题评测集”,不要全刷,只按关键词定位。 |
如果原视频分P标题变化,请按模块关键词人工定位;不要全刷。
一句话理解:检索命中 是完成“RAG 20题评测集”这个任务时必须掌握的一个工程环节。
AI 工程里为什么必须会:检索命中 不是孤立概念,它会影响接口参数、JSON结构、工作流节点、Agent工具、RAG结果或制造业业务数据能否被稳定处理。
项目里怎么用:在“RAG 20题评测集”中,我要用它解决:设计文档内、模糊、无依据问题,记录召回和答案。
面试时怎么说:我会把 检索命中 放到业务场景里讲,先说明它解决什么问题,再说明它如何支撑 FastAPI、RAG、Agent、悟空/DEAP 或 AI表格的落地。
面试官追问怎么答:如果被追问,我会补充它的输入、输出、异常情况和工程边界,避免只背定义。
一句话理解:答案准确 是完成“RAG 20题评测集”这个任务时必须掌握的一个工程环节。
AI 工程里为什么必须会:答案准确 不是孤立概念,它会影响接口参数、JSON结构、工作流节点、Agent工具、RAG结果或制造业业务数据能否被稳定处理。
项目里怎么用:在“RAG 20题评测集”中,我要用它解决:设计文档内、模糊、无依据问题,记录召回和答案。
面试时怎么说:我会把 答案准确 放到业务场景里讲,先说明它解决什么问题,再说明它如何支撑 FastAPI、RAG、Agent、悟空/DEAP 或 AI表格的落地。
面试官追问怎么答:如果被追问,我会补充它的输入、输出、异常情况和工程边界,避免只背定义。
一句话理解:引用准确 是完成“RAG 20题评测集”这个任务时必须掌握的一个工程环节。
AI 工程里为什么必须会:引用准确 不是孤立概念,它会影响接口参数、JSON结构、工作流节点、Agent工具、RAG结果或制造业业务数据能否被稳定处理。
项目里怎么用:在“RAG 20题评测集”中,我要用它解决:设计文档内、模糊、无依据问题,记录召回和答案。
面试时怎么说:我会把 引用准确 放到业务场景里讲,先说明它解决什么问题,再说明它如何支撑 FastAPI、RAG、Agent、悟空/DEAP 或 AI表格的落地。
面试官追问怎么答:如果被追问,我会补充它的输入、输出、异常情况和工程边界,避免只背定义。
一句话理解:拒答率 是完成“RAG 20题评测集”这个任务时必须掌握的一个工程环节。
AI 工程里为什么必须会:拒答率 不是孤立概念,它会影响接口参数、JSON结构、工作流节点、Agent工具、RAG结果或制造业业务数据能否被稳定处理。
项目里怎么用:在“RAG 20题评测集”中,我要用它解决:设计文档内、模糊、无依据问题,记录召回和答案。
面试时怎么说:我会把 拒答率 放到业务场景里讲,先说明它解决什么问题,再说明它如何支撑 FastAPI、RAG、Agent、悟空/DEAP 或 AI表格的落地。
面试官追问怎么答:如果被追问,我会补充它的输入、输出、异常情况和工程边界,避免只背定义。
一句话理解:失败归因 是完成“RAG 20题评测集”这个任务时必须掌握的一个工程环节。
AI 工程里为什么必须会:失败归因 不是孤立概念,它会影响接口参数、JSON结构、工作流节点、Agent工具、RAG结果或制造业业务数据能否被稳定处理。
项目里怎么用:在“RAG 20题评测集”中,我要用它解决:设计文档内、模糊、无依据问题,记录召回和答案。
面试时怎么说:我会把 失败归因 放到业务场景里讲,先说明它解决什么问题,再说明它如何支撑 FastAPI、RAG、Agent、悟空/DEAP 或 AI表格的落地。
面试官追问怎么答:如果被追问,我会补充它的输入、输出、异常情况和工程边界,避免只背定义。
一句话解释:它的本质是让“设计文档内、模糊、无依据问题,记录召回和答案。”变成可执行、可验证、可复用的工程流程。
为什么重要:AI工程面试不只考知道概念,更考能否把概念变成项目产出。
在 AI 工程里的使用场景:FastAPI接口、DEAP工作流、RAG知识库、Agent工具、制造业数据分析。
面试表达:我会先讲业务问题,再讲RAG评测如何支撑这个问题的解决。
一句话解释:企业AI应用要把自然语言、业务字段、接口返回和模型回答整理成结构化输入输出。
为什么重要:没有结构化输入输出,工作流和Agent就无法稳定复用。
在 AI 工程里的使用场景:JSON、API参数、Pydantic模型、Tool Schema、AI表格字段、RAG片段。
面试表达:我会关注每一步的输入、输出和字段含义,而不是只追求模型回答。
一句话解释:AI能力必须有边界:权限、日志、错误兜底、拒答、人审和测试。
为什么重要:企业场景中误调用接口、误写数据、编造答案都会产生真实风险。
在 AI 工程里的使用场景:销帮帮写入、财务问答、合同分析、制造业订单风险预警。
面试表达:我会明确哪些可以自动化,哪些必须人工确认。
产物目录:/Users/hejunkai/Documents/AI工程师/28天每日背诵文档/Day20_RAG评测_实战项目
核心文件:day20_rag_eval_set.json
{
"day": 20,
"theme": "如何用测试集证明RAG不是凭感觉好用",
"modules": [
"检索命中",
"答案准确",
"引用准确",
"拒答率",
"失败归因"
],
"expected": "能用评测定位解析/切分/召回/Prompt问题。"
}验收目标:能用评测定位解析/切分/召回/Prompt问题。
| 操作任务 | 要求 | 验收方式 |
|---|---|---|
| 完成当天实战产物 | 生成或阅读 day20_rag_eval_set.json | 能用评测定位解析/切分/召回/Prompt问题。 |
| 解释输入数据 | 说清用户问题、字段、接口参数或文档来源 | 能说出每个字段的业务含义 |
| 解释处理过程 | 按步骤说明筛选、校验、调用、检索、生成或汇总逻辑 | 别人能按你的说明复现 |
| 解释输出结果 | 说明输出JSON、Markdown、Schema、流程图或讲解稿的用途 | 能关联FastAPI/Agent/悟空/DEAP |
| 准备面试表达 | 用2-3分钟讲清当天主题 | 能回答至少3个追问 |
| 易忘点 | 正确理解 | 错误理解 |
|---|---|---|
| 只背定义 | 要结合业务输入、处理、输出讲 | 把技术点说成百科解释 |
| 忽略产物 | 每天必须有代码、JSON、Schema、流程图或讲解稿 | 只看视频不做东西 |
| 混淆原型和生产 | 原型要如实说,生产还需权限/日志/测试/部署 | 把MVP说成已上线系统 |
| 忽略字段和数据结构 | 企业AI落地关键是字段、接口、数据结构 | 只关注模型回答 |
| 忽略异常兜底 | 接口失败、资料不足、写入风险都要处理 | 假设每次都成功 |