NotebookLM + AI Coding Agent
研究→代码→验证 完整闭环
用 NotebookLM 做 grounded research,结合 Cursor / Claude Code / Gemini 实现自动化 Agent 循环。每步含免费 prompt,开箱即用。
⚡ TL;DR — 30秒速览
- 核心思路:NotebookLM 做研究知识库 → 提炼结构化结果 → Cursor/Claude Code 生成代码 → AI 验证迭代
- 四大 Agent 角色:研究员 (NotebookLM) / 架构师 (Claude/Gemini) / 工程师 (Cursor) / QA (AI对话)
- 闭环节奏:Perceive → Plan → Act → Evaluate,每轮循环 15-30 分钟
- 省 token 核心:用 NotebookLM 预过滤信息,只把精炼上下文传给代码生成工具
- 适用场景:新项目调研、API集成、技术选型、快速原型、学习新技术栈
📑 目录
👤 谁需要这个工作流
独立开发者
一个人做全栈,需要快速调研技术方案并落地为代码。省去来回搜索的时间。
技术 Lead / 架构师
做技术选型和 PoC 验证,需要基于官方文档做精准调研,减少幻觉。
技术学习者
学新技术栈时,用 NotebookLM 吃透文档,用 Cursor 把学习成果直接变成可运行代码。
🎯 核心使用场景
| 场景 | 传统方式 | Agent 工作流 | 效率提升 |
|---|---|---|---|
| 集成新 API(如 Stripe) | 读文档 2h + 写代码 3h | 研究 20min + 生成 30min | ↑ 5x |
| 技术选型对比 | Google + 对比表格 1天 | NotebookLM 对比 40min | ↑ 10x |
| 学习新框架(如 Next.js) | 看教程 + 练习 3天 | 吃文档 + 跑代码 1天 | ↑ 3x |
| 快速原型验证 | 搭建 + 调试 2天 | 研究 + 生成 + 验证 3h | ↑ 5x |
🏗️ Agent 架构总览
整个工作流是一个 Perceive → Plan → Act → Evaluate 的闭环。每一轮循环都会产生更精确的代码。以下是最小可用架构:
研究知识库
技术方案
代码生成
验证迭代
NotebookLM 的独特价值在于 grounded research:它只基于你上传的文档回答问题,极大减少幻觉。把这种精准研究结果喂给 Cursor,比直接让 Cursor 搜网上的信息靠谱 10 倍。
🤖 四大 Agent 角色定义
每个角色有明确职责边界,避免一个 AI 干所有事导致质量下降。
Agent 1:研究员 (Researcher)
工具:NotebookLM
职责:基于上传的文档、API docs、GitHub repos 做深度研究。提炼关键信息,输出结构化的研究摘要。
输出格式:Markdown 摘要 + API 接口清单 + 关键配置项
Agent 2:架构师 (Architect)
工具:Claude / ChatGPT / Gemini
职责:接收研究员的输出,生成技术方案、文件结构、依赖清单。规划代码骨架。
输出格式:技术方案文档 + 目录结构 + 伪代码
Agent 3:工程师 (Engineer)
工具:Cursor / Claude Code / Windsurf
职责:根据架构师的方案,逐文件生成可运行代码。遵循 .cursorrules 约束。
输出格式:完整项目代码 + package.json + 配置文件
Agent 4:质检员 (QA)
工具:Cursor Chat / Claude Code
职责:审查代码质量,运行测试,修复 bug。如果问题超出能力,触发回到 Perceive 阶段重新研究。
输出格式:测试报告 + 修复建议 + 回归检查清单
📋 详细步骤
🔍 用 NotebookLM 构建研究知识库
目标:把散落在各处的技术文档、API 参考、GitHub README 集中到 NotebookLM,让它成为你的项目专属知识库。
具体操作
- 打开 notebooklm.google.com,创建新 Notebook
- 上传项目相关的所有文档源:
- API 官方文档(PDF 或 URL)
- GitHub repo 的 README + 关键源码文件
- 技术博客文章(URL 直接导入)
- 官方 Quick Start / Tutorial 文档
- 建议上传 5-15 个高质量文档源,不要贪多
- 在 NotebookLM 中逐一问关键问题(见下方 prompt)
- 导出/复制所有回答,汇总为一份 研究摘要文档
NotebookLM 支持同时上传 50 个源,但研究发现 5-15 个高质量源 效果最好。太少信息不够,太多会引入噪音。优先选官方文档 > GitHub > 博客。
🧠 让 AI 生成技术方案
目标:把 Step 1 的研究结果转化为可执行的技术方案。这一步决定代码质量的上限。
具体操作
- 打开 Claude(推荐)或 ChatGPT/Gemini
- 将 Step 1 的研究摘要全文粘贴到对话中作为上下文
- 使用下方 prompt 让 AI 生成技术方案
- 审查方案,重点关注:文件结构是否合理、依赖是否最小化、是否有遗漏功能
- 迭代 1-2 轮直到满意,保存最终方案
不要跳过这一步直接让 Cursor 写代码。没有方案的代码生成 = 随机输出。方案越详细,后续代码生成越精准、越少返工。
⚡ 用 Cursor/Claude Code 生成代码
目标:根据技术方案,逐文件生成可运行代码。关键:小批量、高精度、立即验证。
具体操作
- 用 Cursor 打开一个空项目文件夹
- 先设置 .cursorrules:在项目根目录创建此文件,告诉 Cursor 你的技术方案约束
- 用 Composer (Ctrl+I / Cmd+I) 逐个生成文件,不要一次性生成全部
- 每生成一个文件,立即 检查 → 运行 → 确认 再继续下一个
- 遇到报错,直接把错误信息贴回 Cursor 让它修复
- 关键:按技术方案的"实现步骤"顺序来,不要跳步
🔧 .cursorrules 推荐配置
1) 用 @file 引用技术方案文档作为上下文;2) 用 Cmd+K 做行内代码补全;3) 用 Composer 生成多文件相关代码;4) 把 Step 1 的研究摘要放到项目的 /docs 文件夹,Cursor 能自动索引。
✅ 测试、修复与迭代
目标:验证生成的代码能正常工作。发现问题时,决定是直接修复还是回到 Perceive 阶段补充研究。
验证清单
| 检查项 | 方法 | 通过标准 |
|---|---|---|
| 🏗️ 能编译/运行 | npm run dev / python main.py |
无报错启动 |
| 🔗 API 连通性 | 调用核心接口 | 返回预期数据 |
| 🧪 单元测试 | 运行测试套件 | 通过率 ≥ 80% |
| 🔍 代码审查 | AI review + 人工扫描 | 无安全漏洞/逻辑错误 |
| 📊 边界情况 | 输入空值/超大值/错误格式 | 优雅处理,不崩溃 |
如果 Evaluate 发现的问题涉及 API 用法错误、架构不合理、缺少关键依赖,不要硬修。回到 Step 1,在 NotebookLM 中针对性补充研究,然后重新走 Plan → Act → Evaluate。每轮循环代码质量会指数提升。
🔬 完整实战案例
场景:用 Next.js + Stripe 构建一个 SaaS 订阅支付页面
Perceive
上传 Stripe Checkout Docs + Billing API PDF 到 NotebookLM
Plan
Claude 生成:Stripe 产品/价格/Checkout Session 创建流程
Act
Cursor Composer 生成 5 个文件:API route + 前端组件 + webhook
Evaluate
Stripe CLI 本地测试 webhook → 发现签名验证错误 → 修复
⏱️ 时间线
| 阶段 | 耗时 | 产出 |
|---|---|---|
| Perceive | 15 分钟 | Stripe API 研究摘要(含 10 个核心接口) |
| Plan | 10 分钟 | 技术方案(目录结构 + 5 个文件定义) |
| Act | 25 分钟 | 5 个文件、~400 行代码 |
| Evaluate | 15 分钟 | 发现 2 个 bug 并修复,通过测试 |
| 总计 | 65 分钟 | 可运行的 Stripe 订阅支付页面 |
传统方式从零读 Stripe 文档 + 写代码,通常需要 4-8 小时。Agent 工作流 压缩到 1 小时,且因为基于 Stripe 官方文档做 grounded research,代码质量比 Google 搜索 Stack Overflow 更高。
🚀 Token 效率与 Robustness 优化
🎯 Token 效率
- 分层传递上下文:NotebookLM 研究摘要(精炼版)→ Cursor,而不是把原始文档全部传入
- .cursorrules 放常量:把技术方案核心部分放在 .cursorrules,避免每次对话重复输入
- 逐文件生成:一次只让 Cursor 生成 1-2 个文件,而不是整个项目
- 用 @file 而非粘贴:Cursor 的 @file 引用比粘贴代码更省 token
- 压缩 prompt:去掉"请""谢谢""你能帮我吗",直接给指令
🛡️ Robustness 健壮性
- 约束 > 自由:用 .cursorrules 严格限制输出格式,减少随机性
- 立即验证:每生成一个文件就运行,不要攒到后面一起修
- 版本快照:每个阶段完成时 git commit,出问题能快速回退
- 多模型交叉审查:用 Claude 生成代码,用 GPT-4o 审查(不同模型视角互补)
- 失败升级机制:同一问题修复 3 次未解决 → 回到 Perceive 阶段补充研究
⚡ 速度优化
- 并行研究:多个 NotebookLM Notebook 同时研究不同模块
- 模板复用:把成功的 .cursorrules 和 prompt 模板保存到项目仓库
- 快捷键熟手:Cmd+I (Composer), Cmd+K (Inline), Cmd+L (Chat)
- Auto-run 模式:Cursor 设置中开启自动运行终端命令
- 专注模式:关闭不相关的 context7、web search 等插件
🧠 质量优化
- Few-shot 示例:在 prompt 中给出 1-2 个期望输出的示例
- 角色设定:告诉 AI "你是一个有 10 年经验的全栈工程师"
- 渐进式复杂度:先生成最简版本,再逐步添加功能
- 测试先行:让 AI 先写测试,再写实现(TDD Agent 模式)
- 定期重新评估:代码量超过 1000 行后,让 AI 重新审查架构
🤖 工具选型建议
| 工具 | 角色 | 优势 | 费用 | 推荐指数 |
|---|---|---|---|---|
| NotebookLM | 研究 | 免费、grounded、支持多源 | 免费 | ⭐⭐⭐⭐⭐ |
| Claude (Pro) | 规划 + 审查 | 长上下文、推理能力强 | $20/月 | ⭐⭐⭐⭐⭐ |
| Cursor Pro | 代码生成 | IDE 深度集成、Composer | $20/月 | ⭐⭐⭐⭐⭐ |
| Claude Code | 代码生成 | 终端直接操作、自动化强 | 按 token | ⭐⭐⭐⭐ |
| Gemini 2.5 Pro | 规划 + 审查 | 免费额度大、多模态 | 免费/$20/月 | ⭐⭐⭐⭐ |
| GPT-4o | 交叉审查 | 生态成熟、插件丰富 | $20/月 | ⭐⭐⭐⭐ |
NotebookLM(免费)+ Gemini(免费额度)+ Cursor Free = 完整工作流零成本起步。等跑通后再升级到付费版本提升效率。
📥 获取完整 Prompt 模板包
包含本教程所有 prompt 的可编辑版本 + 额外 5 个高级 prompt + .cursorrules 模板库。复制即用,零门槛。
❓ 常见问题 FAQ
NotebookLM 负责基于你上传的文档做深度研究和知识提炼,输出结构化研究结果。将这些结果作为上下文粘贴到 Cursor 的 chat 或 composer 中,或者放到项目的 /docs 文件夹让 Cursor 索引。两者不是替代关系,而是上下游关系:NotebookLM = 研究层,Cursor = 执行层。
最少需要:NotebookLM(免费)+ 任何一个 AI 对话工具(免费即可)。推荐组合:NotebookLM + Claude Pro + Cursor Pro。总共 $40/月,但免费版也能完整跑通。
核心策略:1) 用 NotebookLM 做前置研究过滤信息,只把精炼结果传给 Cursor;2) 使用 .cursorrules 限定输出范围和格式;3) 分步骤小批量生成代码(一次 1-2 个文件);4) 用 @file 引用而非粘贴;5) 去掉 prompt 中的客套话。
Cursor 适合可视化操作、多文件编辑、实时预览。Claude Code 适合自动化脚本、CI/CD 集成、终端重度用户。两者可以混用:用 Cursor 做日常开发,用 Claude Code 做批量重构和自动化任务。
支持。NotebookLM 能处理中英文混合文档,回答也可以用中文。但建议技术文档尽量用英文上传(原始文档质量更高),提问可以用中文。
从零开始到可运行代码:简单项目 30-60 分钟,中等项目 1-3 小时,复杂项目建议拆成多个子循环。关键是每个循环保持短小(15-30 分钟),快速验证。
1) 先把错误信息原样贴回 Cursor 让它自修复(70% 能解决);2) 如果 3 次修复未成功,带着错误回到 NotebookLM 查文档;3) 换一个 AI 模型试试(不同模型擅长不同领域);4) 使用 git 版本控制,随时回退到上一个正常版本。