起因
学习一些AI相关常见术语
GPT是什么意思?
GPT 是 Generative Pre-trained Transformer,即“生成式预训练变换器”,是一种基于 Transformer架构的深度学习模型;如有名的OpenAI 开发的 GPT 系列模型(如 GPT-3、GPT-4)。
预训练和后训练是什么意思?
- 预训练:通过自监督学习,给模型海量的、未经人工标注的原始文本数据,让模型学习语言的基础知识、世界知识和推理能力。预训练完成后,得到的是一个“基础模型”(Base Model)。
- 后训练:在预训练的基础上,通过有监督微调、基于人类反馈的强化学习等方法,教会模型如何更好地遵循指令、进行对话,并符合人类的价值偏好。
LLM是什么意思?
LLM 是 Large Language Model(大语言模型)的缩写,本质上是一个用海量文本训练出来的超大规模神经网络,最擅长的事就是“根据上文预测下一个词”。
Token是什么意思?为什么按Token收费?
- Token:大模型的基本计算单位,像包裹。
- 按 Token 计费:按你的计算工作量(处理包裹的数量)收费。
- 输入/输出:输入是你给模型的包裹(问题),输出是模型给你的包裹(答案)。
- 缓存命中:发生在输入阶段,服务商把相同的输入及其对应的输出暂存起来,发现当前输入和之前某人的输入完全一样,则直接从缓存里把当时的输出拿出来返回。
分词器是什么?
分词器 (Tokenizer) 是负责把人类文字切分成模型能理解的Token序列的组件。
- 进入模型前:分词器把你的句子拆成一个个Token,并编号。
- 离开模型时:模型生成的是一串Token编号,分词器再把这串编号翻译回你能读懂的句子。
不同模型用的分词器不同,所以同一个句子,在不同模型里会被切成不同数量和内容的 Token。 DeepSeek文档
上下文窗口(Context Window)是什么?
即模型在一次处理中,最多能“看到”的Token总数。包括你输入的 Token 和它自己生成的 Token。如果总 Token 数 > 窗口大小:模型会直接截断,只保留窗口末尾的那部分 Token,最早的内容会被“遗忘”。
Function Call是什么?
一种让模型直接“说出”要调用哪个函数、以及用什么参数的标准化接口。
整个调用过程:
- 提供“工具说明书”,在提示词或API的专门字段里,告诉模型当前有哪些可用的函数,每个函数叫什么、有什么参数、是干什么用的
- 模型自动判断并“发起调用”,模型根据说明书推理,在响应里专门带一个function_call字段
- 外部程序执行,结果返回模型
- 模型基于结果生成最终回复
Agent = 模型(LLM) + 泛化的操作环境(Harness)