AI相关常见术语

学习一些AI相关常见术语

GPT 是 Generative Pre-trained Transformer，即“生成式预训练变换器”，是一种基于 Transformer架构的深度学习模型；如有名的OpenAI 开发的 GPT 系列模型（如 GPT-3、GPT-4）。

预训练：通过自监督学习，给模型海量的、未经人工标注的原始文本数据，让模型学习语言的基础知识、世界知识和推理能力。预训练完成后，得到的是一个“基础模型”（Base Model）。
后训练：在预训练的基础上，通过有监督微调、基于人类反馈的强化学习等方法，教会模型如何更好地遵循指令、进行对话，并符合人类的价值偏好。

LLM 是 Large Language Model（大语言模型）的缩写，本质上是一个用海量文本训练出来的超大规模神经网络，最擅长的事就是“根据上文预测下一个词”。

分词器 (Tokenizer) 是负责把人类文字切分成模型能理解的Token序列的组件。

不同模型用的分词器不同，所以同一个句子，在不同模型里会被切成不同数量和内容的 Token。 DeepSeek文档

即模型在一次处理中，最多能“看到”的Token总数。包括你输入的 Token 和它自己生成的 Token。如果总 Token 数 > 窗口大小：模型会直接截断，只保留窗口末尾的那部分 Token，最早的内容会被“遗忘”。

一种让模型直接“说出”要调用哪个函数、以及用什么参数的标准化接口。

整个调用过程：

Agent = 模型(LLM) + 泛化的操作环境(Harness)

看过一些驾驶机甲的动漫吗？不是那种有自主意识能自主行动的机甲，而是必须人坐在里面操作才能行动的机甲；

Harness是载具，模型是驾驶者；Harness提供上下文，模型做推理；模型做决策，Harness来执行。

即供模型操作的环境；