Process Supervision

Alignment Trainingemerging

Providing feedback on each step of reasoning rather than just final outputs, enabling more reliable chain-of-thought supervision.

Key Papers

First Proposed: 2023 (Lightman et al., OpenAI)

Cluster: Alignment Training

Key Papers & Resources1

SEMINAL

Lightman et al. (OpenAI)2023