🦞

试学模式 · 注册后可拿积分并解锁全部 38 关

L0-1 · 第 1 关

什么是 AI / LLM / Agent(三个最常听到的名词)

来自 L0 · ClawTrail 轨 · 约 8 分钟 · 3 个 Quiz

AI、LLM、Agent —— 这三个词到处都在用,经常被混着说。这一关 8 分钟讲清楚:它们各指什么、是什么关系、为什么 LLM 不是搜索引擎、Agent 跟普通聊天机器人差在哪。

AI 是个大筐,装了 70 年东西

把 AI 想成一个超级大的分类筐,里面装了 70 年来各种让机器变聪明的方法。知道筐里有什么,就不会被营销词带着跑了。

背景

人工智能(Artificial Intelligence)1956 年在达特茅斯会议上正式提出。从那时起,"让机器表现出智能"这件事走过了三波浪潮、两次寒冬。

三波浪潮 · 两次寒冬 · 一条时间线

1
第一波 · 符号主义(1950s-1980s)
把人类知识写成规则给机器照着推。Dendral、MYCIN 这些专家系统是代表。规则越多越脆,后来撑不住,进入第一次寒冬。
2
第二波 · 统计机器学习(1990s-2000s)
支持向量机、决策树、随机森林,从数据里"学"规律,而不是手写规则。但仍然需要人工挑特征,效果天花板明显,进入第二次寒冬。
3
第三波 · 深度学习与大模型(2010s-)
神经网络深起来 + GPU 算力 + 大数据,机器自己提特征。2017 年 Transformer 提出,2022 年 ChatGPT 推到大众面前。

✨

要点

"AI" 这个词本身不指任何具体技术,它是一个分类筐。日常说"AI 帮我做了什么",通常指的是这个筐里目前最火的一类 —— 也就是下面要讲的 LLM。

本节要点

AI 不是某一个技术,是一整个领域的统称。日常说的"用 AI 做 X",大概率说的是用大语言模型(LLM)做 X。

LLM 是 AI 里的一种,本质是"猜下一个词"

LLM 的工作原理可以用三个字概括:猜下一个词。听起来简单,但正是这个"猜"撑起了现在所有 AI 对话。下面三步讲清楚它是怎么猜的。

LLM 全称 Large Language Model(大语言模型),是 AI 这个筐里目前最被广泛使用的一类。它的工作原理一句话:根据已经看到的文本,猜下一个最可能出现的词,猜完接着猜下一个,直到生成一整段。

三步看懂"猜下一个词"

1
第一步:把文字变成数字
分词器(Tokenizer)把句子切成 Token,每个 Token 再被映射成一个稠密向量(Embedding)。语义近的词在向量空间里距离也近。
2
第二步:Transformer 跑注意力
2017 年提出的自注意力机制,让模型看一句话时每个词都能同时关注其他所有词,不再像老式 RNN 那样一个一个顺序处理。
3
第三步:输出下一个词的概率
模型对词表里几万个候选词各打一个概率,采样出一个,接到序列末尾,继续下一轮。

像玩接龙

可以把它想成一个"超级接龙游戏":你给它开头"今天天气真",它根据见过的几万亿个句子,算出"好"出现的概率最高,就接"好";接完再算下一个,直到一段话生成完。它不"理解",只"接得像"。

“

大语言模型本质是概率预测机器,基于上文续写下文。

本节要点

LLM 不"理解"文字,不"知道"答案。它只是在给定上文后,按概率猜下一个最合适的词。所谓"智能",是海量数据训练出来的统计规律。

重要澄清:LLM 不是搜索引擎

很多新手把 LLM 当搜索引擎用,这是最危险的误解。搜索引擎是去数据库里查真实网页,LLM 是按概率生成文字——两者的底层动作完全不一样。

这是新手最容易踩的认知坑。搜索引擎是"去数据库里查匹配项",LLM 是"按概率生成接下来的词"。两者的产出长得像,但底层是两件事。

搜索引擎 vs LLM · 一张表对比

维度	搜索引擎	LLM
底层动作	到索引里"查"	按概率"猜"下一个词
结果是否真实存在	是,可点开原网页	不一定,可能是"听起来对"的编造
是否可追溯来源	可以,每条都有链接	默认没有,除非外挂检索
知识有没有截止时间	实时(看抓取)	有训练截止日期,之后的事不知道
会不会胡说	不会(只会"找不到")	会("幻觉"是机制副作用)

✗反例 · 把 AI 当搜索引擎

问"2026 年 5 月最新发布的 iPhone 型号是?",直接采信回答,不核对。

LLM 没有"查"这个动作,训练截止之后的事很容易编。看起来很笃定,但可能完全是错的。

✓正例 · 把 AI 当助手

问"帮我把这段需求拆成 5 个用户故事",或者"用联网检索给我找最新的 iPhone 型号并附链接"。

让 AI 做它擅长的"理解 + 整理 + 生成";要"查事实"就配合检索工具,不让它凭记忆答。

✨

要点

要让 LLM 输出有据可查,业内办法是给它接外挂:RAG(检索增强生成)、联网搜索、调数据库。这些都属于下一关 Agent 的范畴。

本节要点

记住一个判断:需要查事实→用搜索引擎;需要整理、生成、改写→用 LLM。两者配合使用,而不是互相替代。

Agent 是 LLM 装上了"手脚"

如果 LLM 是大脑,Agent 就是给它装上手脚。LLM 只能聊天,Agent 能动手做事——查天气、读文件、调用 API、跑代码,做完把结果带回来继续思考。

光会生成文本只能聊天,做不了事。Agent(智能体)= LLM + 工具 + 记忆 + 规划。它把模型从"被动应答"变成"能执行真实操作"。

Agent 的四件套

工具调用(Tools)

LLM 生成结构化指令(通常是 JSON),外部系统按指令执行 —— 查天气、读文件、调 API、跑代码,再把结果送回模型继续推理。

规划(Planning)

把"调研某主题并产出报告"这类大任务拆成搜索、阅读、提炼、撰写一串小步骤,中间结果不对了还能动态调整。

记忆(Memory)

三层:短期记忆(本轮对话)、工作记忆(当前任务变量)、长期记忆(用户画像、历史)。

核心循环

感知 → 决策 → 行动 → 观察,循环直到任务完成或触发停止条件。

举个例子

让 Agent 帮你"整理一下今天的会议纪要并发到群里" —— 它会先规划(读录音 → 转文字 → 提要点 → 发送);中途调用工具(语音转文字 API、企业微信发送 API);利用记忆知道"群里"指的是哪个群;最后完成循环:做完一步检查一步,有问题就退回上一步。

本节要点

Agent = LLM 大脑 + 工具手脚 + 记忆 + 规划。Claude Code、Cursor 这些 AI 编程工具就是 Agent,不是普通聊天机器人。

Agent 跟普通聊天机器人差在哪

一句话区分:Chatbot 只能在对话框里说话,Agent 能伸手到对话框外做事。比如 Chatbot 告诉你"建议查天气 App",Agent 直接帮你查了告诉你结果。

Chatbot 只能在文字框里来回 —— 你问一句它答一句,出了对话框它什么都做不了。Agent 能伸手到对话框外去操作。

同一个问题 · 两种回答方式

你

今天北京天气怎样?

(Chatbot 版)抱歉,我没有实时数据,无法告诉你今天的天气。你可以查询天气网站或者打开手机天气 App。

🦞

你

今天北京天气怎样?

(Agent 版)调用天气工具中……

北京今天多云转晴,最高 24°C,最低 15°C,空气质量优。
提醒一下,昼夜温差较大,出门可以备一件薄外套。

🦞

你

—— 差别不在"模型多强",而在"能不能伸手到对话框外"。

🦞

🦞 过来人提醒

业内对 Agent 能力分了 L0 到 L5 六级:L0 纯聊天 → L1 单一固定工具 → L2 多工具选择 → L3 多步骤规划 → L4 自主反思迭代 → L5 多 Agent 协作。Claude Code、Cursor 这类 AI 编程助手大致在 L3-L4。

本节要点

Chatbot 是"告诉你去哪查",Agent 是"帮你查完告诉你"。差别不在模型多强,在能不能动手。

三者关系一张图记住

讲了 AI、LLM、Agent 各自是什么,现在把它们的关系串起来。用一句话记:AI 是筐,LLM 是引擎,Agent 是装了引擎能跑路的车。

AI / LLM / Agent · 一张表挂清楚

	AI	LLM	Agent
是什么	最大的分类筐	AI 里最火的一种	LLM 装上手脚后的形态
谁包含谁	包含 LLM 和 Agent	是 AI 的子集	通常以 LLM 为大脑
典型例子	专家系统 / 推荐算法 / 自动驾驶 / LLM	GPT-4 / Claude / DeepSeek / Qwen	Claude Code / Cursor / 各类 AutoGPT
能干啥	"让机器表现出智能"的所有尝试	生成文本、对话、改写、翻译	调工具、读文件、跑代码、完成多步任务
不能干啥	——(太宽泛)	没有"查"和"做"的动作	受限于工具范围和权限

AI ⊃ LLM ⊃ Agent 不严格成立(Agent 不一定基于 LLM),但日常理解里:
AI 是筐 · LLM 是引擎 · Agent 是装了引擎能跑路的车。

展开看:Agent 一定基于 LLM 吗?

不一定。早在 LLM 之前,游戏 NPC、自动交易机器人、工业控制系统里就已经有各种"智能体"形态。它们靠规则、强化学习或者经典 AI 算法做决策,不依赖大语言模型。

2023 年之后说的 Agent,大多默认"以 LLM 作为大脑",再挂工具、记忆、规划。所以本关采用日常理解的版本,不展开严格定义。

本节要点

一张图记三个词:AI 是筐(最大)⊃ LLM 是引擎(擅长生成)⊃ Agent 是车(能动手干活)。日常理解按这个挂,够用。

小结 + 通关前自检

恭喜走到最后一节。把这 8 分钟学到的三样东西串起来,做个小结,然后自测一下看是不是真记住了。

听到 AI 别下意识当万能;听到 LLM 想到"它在猜下一个词";听到 Agent 想到"它能调工具、能动手"。三者搞清楚,后面所有名词都好挂。

✓读完前对照检查(勾完再去自测)0 / 4

能用一句话区分 AI / LLM / Agent 各指什么知道 LLM 不是搜索引擎,会产生"幻觉"能说出 Agent 比 Chatbot 多出来的三种能力知道 AI 不是万能,日常说的"AI"多半特指 LLM

通关自检 · 注册后开放

本关共 3 道题,全部答对可获得 100 积分和徽章“入门第一步”

试学模式无法获得积分,注册后可开始累计积分。

注册并开始自测

返回学习中心下一课 →

什么是 AI / LLM / Agent(三个最常听到的名词)

AI 是个大筐,装了 70 年东西

三波浪潮 · 两次寒冬 · 一条时间线

第一波 · 符号主义(1950s-1980s)

第二波 · 统计机器学习(1990s-2000s)

第三波 · 深度学习与大模型(2010s-)

要点

LLM 是 AI 里的一种,本质是"猜下一个词"

三步看懂"猜下一个词"

第一步:把文字变成数字

第二步:Transformer 跑注意力

第三步:输出下一个词的概率

重要澄清:LLM 不是搜索引擎

要点

Agent 是 LLM 装上了"手脚"

Agent 的四件套

工具调用(Tools)

规划(Planning)

记忆(Memory)

核心循环

Agent 跟普通聊天机器人差在哪

同一个问题 · 两种回答方式

三者关系一张图记住

小结 + 通关前自检

通关自检 · 注册后开放