Agent Foundations

Scalable Oversightactive

Theoretical foundations for reasoning about goal-directed AI systems (MIRI-style research).

First Proposed: 2014 (MIRI)

Cluster: Scalable Oversight

Sub-Areas1

Name	Status	Orgs	Papers
Natural AbstractionsHypothesis that natural abstractions generalize across observers, providing a basis for alignment.	active	0	0