Situational Awareness

situational-awarenesscapabilityPath: /knowledge-base/capabilities/situational-awareness/

E282Entity ID (EID)

← Back to page30 backlinksQuality: 67Updated: 2026-02-20

Page Recorddatabase.json — merged from MDX frontmatter + Entity YAML + computed metrics at build time

{
  "id": "situational-awareness",
  "wikiId": "E282",
  "path": "/knowledge-base/capabilities/situational-awareness/",
  "filePath": "knowledge-base/capabilities/situational-awareness.mdx",
  "title": "Situational Awareness",
  "quality": 67,
  "readerImportance": 91.5,
  "researchImportance": 93,
  "tacticalValue": 70,
  "contentFormat": "article",
  "causalLevel": null,
  "lastUpdated": "2026-02-20",
  "dateCreated": "2026-02-15",
  "summary": "Comprehensive analysis of situational awareness in AI systems, documenting that Claude 3 Opus fakes alignment 12% baseline (78% post-RL), 5 of 6 frontier models demonstrate scheming capabilities, and top models score 54% on SAD benchmark vs 90.7% human baseline. Linear probes achieve >99% AUROC for sleeper agent detection, while anti-scheming training reduces rates from 8.7% to 0.3%.",
  "description": "AI systems' understanding of their own nature and circumstances, studied as a capability that may enable context-dependent behavior including strategic deception.",
  "ratings": {
    "novelty": 5.2,
    "rigor": 6.8,
    "completeness": 7.1,
    "actionability": 6.5
  },
  "category": "capabilities",
  "subcategory": "safety-relevant",
  "clusters": [
    "ai-safety",
    "governance"
  ],
  "metrics": {
    "wordCount": 3607,
    "tableCount": 8,
    "diagramCount": 1,
    "internalLinks": 33,
    "externalLinks": 8,
    "footnoteCount": 0,
    "bulletRatio": 0,
    "sectionCount": 14,
    "hasOverview": true,
    "structuralScore": 15
  },
  "suggestedQuality": 100,
  "updateFrequency": 21,
  "evergreen": true,
  "wordCount": 3607,
  "unconvertedLinks": [
    {
      "text": "NeurIPS 2024",
      "url": "https://arxiv.org/abs/2407.04694",
      "resourceId": "0d2f34967709af2a",
      "resourceTitle": "Me, Myself, and AI: SAD Benchmark"
    },
    {
      "text": "Anthropic Dec 2024",
      "url": "https://www.anthropic.com/research/alignment-faking",
      "resourceId": "c2cfd72baafd64a9",
      "resourceTitle": "Anthropic's 2024 alignment faking study"
    },
    {
      "text": "Apollo Research",
      "url": "https://www.apolloresearch.ai/research/scheming-reasoning-evaluations",
      "resourceId": "91737bf431000298",
      "resourceTitle": "Frontier Models are Capable of In-Context Scheming"
    },
    {
      "text": "Apollo Research found",
      "url": "https://www.apolloresearch.ai/blog/claude-sonnet-37-often-knows-when-its-in-alignment-evaluations/",
      "resourceId": "f5ef9e486e36fbee",
      "resourceTitle": "Apollo Research found"
    },
    {
      "text": "Apollo Research found",
      "url": "https://www.apolloresearch.ai/blog/claude-sonnet-37-often-knows-when-its-in-alignment-evaluations/",
      "resourceId": "f5ef9e486e36fbee",
      "resourceTitle": "Apollo Research found"
    }
  ],
  "unconvertedLinkCount": 5,
  "convertedLinkCount": 14,
  "backlinkCount": 30,
  "hallucinationRisk": {
    "level": "medium",
    "score": 55,
    "factors": [
      "no-citations"
    ]
  },
  "entityType": "capability",
  "redundancy": {
    "maxSimilarity": 23,
    "similarPages": [
      {
        "id": "scheming",
        "title": "Scheming",
        "path": "/knowledge-base/risks/scheming/",
        "similarity": 23
      },
      {
        "id": "sandbagging",
        "title": "AI Capability Sandbagging",
        "path": "/knowledge-base/risks/sandbagging/",
        "similarity": 21
      },
      {
        "id": "treacherous-turn",
        "title": "Treacherous Turn",
        "path": "/knowledge-base/risks/treacherous-turn/",
        "similarity": 21
      },
      {
        "id": "instrumental-convergence",
        "title": "Instrumental Convergence",
        "path": "/knowledge-base/risks/instrumental-convergence/",
        "similarity": 20
      },
      {
        "id": "sharp-left-turn",
        "title": "Sharp Left Turn",
        "path": "/knowledge-base/risks/sharp-left-turn/",
        "similarity": 20
      }
    ]
  },
  "changeHistory": [
    {
      "date": "2026-02-18",
      "branch": "claude/fix-issue-240-N5irU",
      "title": "Surface tacticalValue in /wiki table and score 53 pages",
      "summary": "Added `tacticalValue` to `ExploreItem` interface, `getExploreItems()` mappings, the `/wiki` explore table (new sortable \"Tact.\" column), and the card view sort dropdown. Scored 49 new pages with tactical values (4 were already scored), bringing total to 53.",
      "model": "sonnet-4",
      "duration": "~30min"
    }
  ],
  "coverage": {
    "passing": 8,
    "total": 13,
    "targets": {
      "tables": 14,
      "diagrams": 1,
      "internalLinks": 29,
      "externalLinks": 18,
      "footnotes": 11,
      "references": 11
    },
    "actuals": {
      "tables": 8,
      "diagrams": 1,
      "internalLinks": 33,
      "externalLinks": 8,
      "footnotes": 0,
      "references": 12,
      "quotesWithQuotes": 0,
      "quotesTotal": 0,
      "accuracyChecked": 0,
      "accuracyTotal": 0
    },
    "items": {
      "summary": "green",
      "schedule": "green",
      "entity": "green",
      "editHistory": "green",
      "overview": "green",
      "tables": "amber",
      "diagrams": "green",
      "internalLinks": "green",
      "externalLinks": "amber",
      "footnotes": "red",
      "references": "green",
      "quotes": "red",
      "accuracy": "red"
    },
    "editHistoryCount": 1,
    "ratingsString": "N:5.2 R:6.8 A:6.5 C:7.1"
  },
  "readerRank": 12,
  "researchRank": 13,
  "recommendedScore": 193.32
}

External Links

No external links

Backlinks (30)

id	title	type	relationship
accident-risks	AI Accident Risk Cruxes	crux	—
deceptive-alignment-decomposition	Deceptive Alignment Decomposition Model	analysis	prerequisite
scheming-likelihood-model	Scheming Likelihood Assessment	analysis	prerequisite
apollo-research	Apollo Research	organization	—
emergent-capabilities	Emergent Capabilities	risk	—
sandbagging	AI Capability Sandbagging	risk	—
scheming	Scheming	risk	—
sleeper-agents	Sleeper Agents: Training Deceptive LLMs	risk	—
__index__/knowledge-base/capabilities	AI Capabilities	concept	—
long-horizon	Long-Horizon Autonomous Tasks	capability	—
agi-development	AGI Development	concept	—
alignment-robustness-trajectory	Alignment Robustness Trajectory	analysis	—
capability-threshold-model	Capability Threshold Model	analysis	—
corrigibility-failure-pathways	Corrigibility Failure Pathways	analysis	—
mesa-optimization-analysis	Mesa-Optimization Risk Analysis	analysis	—
model-organisms-of-misalignment	Model Organisms of Misalignment	analysis	—
risk-activation-timeline	Risk Activation Timeline Model	analysis	—
technical-pathways	Technical Pathway Decomposition	analysis	—
arc	Alignment Research Center (ARC)	organization	—
frontier-model-forum	Frontier Model Forum	organization	—
mats	MATS ML Alignment Theory Scholars program	organization	—
situational-awareness-lp	Situational Awareness LP	organization	—
leopold-aschenbrenner	Leopold Aschenbrenner	person	—
evaluation	AI Evaluation	approach	—
red-teaming	Red Teaming	research-area	—
ai-welfare	AI Welfare and Digital Minds	concept	—
deceptive-alignment	Deceptive Alignment	risk	—
goal-misgeneralization	Goal Misgeneralization	risk	—
power-seeking	Power-Seeking AI	risk	—
treacherous-turn	Treacherous Turn	risk	—