Chain-of-Thought (CoT, 사고의 연쇄)

별칭: chain-of-thought · Chain-of-Thought · Chain of Thought · chain of thought · CoT · cot · CoT prompting · 사고의 연쇄 · 체인 오브 소트 · 체인오브소트 · 단계별 추론

모델이 결론만 내지 않고 중간 추론 과정을 단계별로 적게 만드는 프롬프팅 기법.

"문제를 풀기 전에 단계별로 생각하라(Let's think step by step)" 처럼 추론 과정을 글로 풀어 쓰게 유도하는 방식. 산수, 논리, 복합 추론처럼 한 번에 답하면 틀리는 문제에서 정답률을 크게 끌어올린다. 단점은 토큰·지연 증가.

정의

Chain-of-Thought (CoT) 는 답을 곧바로 말하지 않고 풀이 과정을 자연어로 단계별로 적게 만드는 프롬프팅 기법이다. 2022년 Google Brain 의 Wei et al. 논문에서 정식 제시됐다.

왜 효과가 있는가

큰 LLM 은 단계별로 추론하는 토큰을 더 많이 출력하면, 그 과정 자체가 일종의 "내적 작업 공간" 이 된다. 한 번에 정답을 뽑아내려고 하면 빠뜨리던 중간 정보를 글로 풀어쓰면서 정합성을 높일 수 있다.

변형

  • Zero-shot CoT: 예시 없이 "단계별로 생각해 줘" 라는 지시 한 줄만으로 효과를 본다.
  • Few-shot CoT: 예시 자체에 풀이 과정을 함께 적어 둔다.
  • Self-consistency: 여러 번 풀게 한 뒤 다수결로 최종 답을 고른다.

언제 쓰는가

  • 산수·논리·다단계 추론 문제
  • 법·정책·계약처럼 근거를 같이 보여줘야 하는 답변
  • 모델이 자주 헷갈리는 분류 — 분류 근거를 함께 적게 하면 일관성이 올라간다

주의

모든 작업에 도움이 되진 않는다. 단순 분류·번역·요약처럼 한 번에 답해도 되는 작업에서는 토큰만 늘리는 결과가 된다. 또 추론 과정 자체가 사용자에게 노출되면 안 되는 경우엔 "내부적으로만 추론하고 결과만 보여라" 같은 추가 지시가 필요하다.