Skip to content

SFT

Supervised Fine-Tuning

SFT 通常指用人工或高质量合成的指令数据,对预训练模型做监督微调,让模型从“会续写”变成“更会按要求回答”。

核心概念

  • SFT 样本通常是 (instruction, input, output) 或多轮对话格式。
  • Instruction Tuning 的目标不是新增全部知识,而是把已有能力组织成更可用的接口。
  • 常见数据来源包括人工标注、教师模型蒸馏、规则生成和混合数据集。
  • 很多模型的 chat template、角色 token、system/user/assistant 格式,都是在这一步定型。
  • SFT 往往提升可用性和遵循性,但也可能损失一部分 base model 的开放性。