工作室功能 · 测评10个免费 · 12个付费

测验(Quiz)——知识测评生成器

NotebookLM测验功能直接从上传素材生成知识测评——选择题、简答题和论述题,每道题均附带引用来源文档的完整答案。可按题目数量、难度等级、主题重点和题目类型自定义。无论你是自测的学生还是出题的教师,每道题都可追溯至素材中的具体证据。生成仅需30–60秒。

⭐ 精选提示词 — 立即复制
分析这些来源材料,提取3个最重要的洞察。每个洞察需要:核心发现、支持证据、实际应用场景。最后给出一个综合结论。
为何值得信赖? 由一支深度使用AI的教育工作者和研究者小团队撰写,他们已在学术、企业培训和职业发展场景中持续使用NotebookLM测验功能,并跨越多个功能更新周期进行了实际测试。无商业利益关联。2026年3月更新。

NotebookLM测验功能有什么用——为什么它有效?

测验功能将被动阅读转化为主动测试。与其反复翻看笔记寄望于记住,不如用同一份材料生成测验来检验实际记忆。这种学习方式在认知科学中称为测试效应(又称提取练习)——大量研究一致表明,它在长期记忆效果上远超重复阅读。2021年一项针对提取练习研究的元分析显示,其学习效果量(effect size)显著高于被动复习。

每套测验均附带含引用来源的完整答案。答错时,你看到的不仅是正确答案——还可直接跳转至素材文档中该信息所在的原文段落。这在测试与学习之间形成了闭合反馈回路:答错的题目成为精准复习的切入点。

对教育工作者而言,测验功能解决了一个耗时的备课难题:创建高质量试卷。上传一个单元的指定阅读材料,30秒生成测验,审核调整题目,一份课堂评估就准备好了。由于功能本身锚定于素材,题目考查的是指定阅读材料中的实际内容,而非泛化知识。

什么场景最适合使用NotebookLM测验功能?

阅读后自测是最高价值的使用场景。上传一篇论文或一个章节,读完后生成测验以检测理解程度。你以为自己理解了的内容与实际能答出的内容之间的落差,恰好指明了复习重点。

课堂评估准备大幅节省备课时间。上传课程材料,生成不同难度的测验,并根据不同目的进行自定义:低风险知识检查、单元中期复习或全面的期末备考。

培训验证适用于企业场景,用于确认团队成员确实消化了培训内容。培训结束后,从培训文档生成测验让参与者完成——结果会精确指出哪些方面还需要强化。

NotebookLM自动生成测验有哪些局限性?

自动生成的题目偶尔会聚焦于细枝末节而非核心概念。分发前务必审核——删除琐碎题目,补充AI遗漏的重要主题。论述题以提示词加范文答案的形式呈现,但评分标准较为基础;正式评分建议单独制定评分量规。选择题的干扰项通常合理,但偶尔明显,修改选项能明显提升测验质量。

速览:NotebookLM测验功能可在30–60秒内生成锚定于素材的知识测评,每道题均引用所考查的具体段落。最佳使用场景:阅读后自测、课堂评估和企业培训验证。主要局限:自动生成的题目偶尔遗漏关键概念——分发前务必审核。

分步操作流程

6个步骤
01

上传测评素材

添加测验所依据的文档。课堂评估只上传该单元的指定阅读材料;自测则上传你正在学习的内容。

02

在工作室面板中打开测验

点击测验(Quiz)图块,界面将显示格式、难度和题目数量的自定义选项。

03

配置测验参数

设置:题目数量、难度等级、题目类型(选择题、简答题、论述题)和主题重点。在提示词栏输入具体指令,例如「聚焦第3–5章」或「考查分析应用能力,而非单纯记忆」。

04

生成并审核

点击生成。测验将显示题目及单独的答案键。逐题审核:题目是否公平?是否考查了重点内容?干扰项是否合理?根据需要编辑或删除题目。

05

自测或分发

自主学习:先独立回答所有问题,再对照答案键。教学场景:将题目(不含答案)复制到LMS或文档中,答案键单独分享或用于批改。

06

用结果引导后续学习

针对答错的题目,点击答案中的引用查看原始素材段落。将后续学习精力集中在薄弱环节。进一步学习后重新生成测验,以检验进步。

提示词

10个免费 · 12个付费

自主学习与复习

5条提示词
生成一套包含20道题、难度递进的测验。第1–6题:基础记忆(定义、关键事实、日期)。第7–12题:理解层面(解释原因、描述过程、进行比较)。第13–17题:应用层面(在给定情境下会发生什么?哪种方案更合适?)。第18–20题:综合层面(整合多个素材的洞察、评估相互竞争的观点)。每道题注明所属难度层级。
创建一套「认知误区纠错」测验——15道判断题,每道题的表述听起来都很合理,但其中一半存在细微错误。答案键不仅要说明每道题是对是错,还要解释:错误观点为何普遍存在,以及正确理解是什么。题目应专门针对学习这份材料时容易踩坑的具体误区。
生成一套考查跨素材理解能力的测验。每道题至少需要从2份不同的上传文档中提取信息才能正确作答。这考查的是综合能力——连接不同阅读材料中的观点。包含5道「素材A的观点是X,素材B的观点是Y——你如何调和这两者的分歧?」类型的题目。
创建一套「闪电测验」——25道可在10分钟内完成的快答题。题目简短,答案简短。每个主要主题至少包含一道题,覆盖素材中所有核心内容。这套测验用于快速复盘:如果能全部答对,说明你已掌握扎实的基础知识。答案键每道题仅用一句话作答。
生成一套「前测+后测」题目对。测验A:10道在学习这份材料前完成的前测题。测验B:学习后针对相同概念的10道不同题目(后测)。两套测验覆盖相同主题,但题目不同,确保无法「原题照搬」作答。包含一份评分指南,将分数区间对应到推荐的下一步学习行动。

课堂教学与企业培训

5条提示词
创建一套适合大学期中考试水平的测验,包含:10道选择题(每题4个选项:一个明显最佳答案、两个有迷惑性的干扰项、一个明显错误选项),5道简答题(预期答案为2–3句话),以及2道论述题(附300字以上的范文答案)。总计答题时间:75分钟。提供分值分配方案和评分量规。
生成一套案例分析测验。根据这些素材的核心主题,呈现一个详尽、贴近现实的情境(3–4段)。然后围绕该案例提出8道问题:3道要求识别哪些概念适用于该情境,3道要求运用素材中的框架提出解决方案,2道要求批判性地评估该案例。提供附有素材引用的范文答案。
创建一套「同伴教学」测验——10道题,预期答案不是简单陈述事实,而是像向同学讲解一样加以解释。评分量规应考察三个维度:准确性(核心事实是否正确?)、清晰度(同学能否听懂?)、深度(是否不止于定义层面?)。每道题提供「优秀」「合格」「有待改进」三档范文答案。
生成一套辩论备赛测验。提出与这些素材相关的8个有争议或可辩论的主张。针对每个主张,学生需要:(1) 找出支持该主张的最有力证据,(2) 找出反对该主张的最有力证据,(3) 陈述自己的立场并给出理由。答案键为正反两方均提供平衡的论点。
为职业培训创建一套「实际应用」测验。根据这些素材中的概念,呈现10个职场情境。针对每个情境,提问:「你会怎么做?为什么?」答案键应从以下三个维度评估作答:与素材中最佳实践的契合度、回答的完整性,以及对潜在风险或复杂因素的识别。
付费——解锁全部提示词

基础已就绪,更进一步。

剩余的付费提示词涵盖进阶工作流、专项使用场景和为专业及学术工作设计的生产级模板。

全部提示词 + 完整指南库——一次性获取

解锁付费内容 — $19.99
🔒 完整考试构建器——50+题目,含自动分值分配、答题时间建议和多套试卷版本
🔒 布鲁姆分类法对齐——题目按认知层级标注,均衡覆盖全部6个层级
🔒 自适应难度测验——根据答题规律动态调整题目序列,难度随之升降
🔒 评分量规生成器——基于素材内容,为论述题和简答题生成细化评分标准
常见问题

NotebookLM能生成多选题吗?

+
可以,但需要在提示词中明确指定。使用类似这样的格式指令:生成10道四选一多选题,每题提供正确答案和错误选项的解释。 NotebookLM不会自动选择题型——你需要告诉它想要多选题、判断题还是简答题。明确的题型指令会产生更结构化的输出。

生成的测验题有多准确?

+
高度准确,前提是来源材料质量好。NotebookLM的RAG架构确保所有题目都来自你上传的文档,不会凭空捏造事实。对于高风险考试备考,建议审查答案说明——偶尔会出现措辞不够精准的情况,但事实性错误很少见。

我可以让NotebookLM批改学生答案吗?

+
间接可以。将学生答案粘贴到聊天框,附上这样的提示词:对照来源资料批改以下答案,指出每题正确与否并说明原因。 这不是自动化批改系统,但对于小班(10到20人)的快速反馈非常有效。批量批改时,每次提交一个学生的全套答案效率最高。

能生成针对不同难度的题目吗?

+
完全可以。使用布鲁姆分类法在提示词中指定难度:记忆层(定义与事实回忆)、理解层(解释概念)、应用层(将原则应用到新场景)、分析层(比较与辨别)。生成5道记忆层和5道分析层题目这样的指令会产生涵盖不同认知深度的均衡题组。

测验题可以导出为标准格式吗?

+
目前没有一键导出到LMS的功能。最常用的工作流是:复制输出后粘贴到Google Forms(逐题添加)、Canvas题库导入格式,或简单的Word或PDF文档。对于Moodle,可将题目格式化为GIFT格式再导入。虽需手动步骤,但比从零编写题目快得多。
相关指南推荐
论文阅读工作流 →
30个提示词加速学术阅读
4-AI协同调度 →
NotebookLM+Claude+Gemini+Perplexity
5分钟生成幻灯片 →
从任意来源快速生成演示稿
内容炼金术 →
一份来源生成多平台内容