Weak-to-Strong Generalization

Alignment Trainingemerging

Research on whether weak supervisors can effectively train stronger AI systems, a core challenge for superalignment.

Key Papers

First Proposed: 2023 (Burns et al., OpenAI)

Cluster: Alignment Training

Key Papers & Resources1

SEMINAL

Burns et al. (OpenAI)2023