SFT
Supervised Fine-Tuning
SFT 通常指用人工或高质量合成的指令数据,对预训练模型做监督微调,让模型从“会续写”变成“更会按要求回答”。
核心概念
- SFT 样本通常是
(instruction, input, output)或多轮对话格式。 - Instruction Tuning 的目标不是新增全部知识,而是把已有能力组织成更可用的接口。
- 常见数据来源包括人工标注、教师模型蒸馏、规则生成和混合数据集。
- 很多模型的
chat template、角色 token、system/user/assistant 格式,都是在这一步定型。 - SFT 往往提升可用性和遵循性,但也可能损失一部分 base model 的开放性。