Skip to content

Reasoning 范式

Reasoning 范式关注模型在推理时如何组织中间步骤。

核心概念

  • CoT:让模型显式输出中间推理步骤。
  • ReAct:把 reasoning 与 action 交替进行,特别适合需要检索或调用工具的任务。
  • ToT:把多种候选思路组织成树,再搜索或打分。
  • Reflexion:根据历史失败记录或自评信息调整下一轮尝试。
  • 这些方法往往会和 self-consistency、best-of-n、tool use、verifier 等机制组合。