Longterm Wiki

Field

Section

Entity

25 itemsHas structured data

Situational Awareness

Comprehensive analysis of situational awareness in AI systems, documenting that Claude 3 Opus fakes alignment 12% baseline (78% post-RL), 5 of 6 fr...

deceptionself-awarenessevaluations

Capability

3.8k words

Tool Use and Computer Use

Tool use capabilities achieved superhuman computer control in late 2025 (OSAgent: 76.26% vs 72% human baseline) and near-human coding (Claude Opus ...

computer-usefunction-callingapi-integration

Capability

4.9k words

Reasoning and Planning

Comprehensive survey tracking reasoning model progress from 2022 CoT to late 2025, documenting dramatic capability gains (GPT-5.2: 100% AIME, 52.9%...

decision-theoryepistemicsmethodology

Capability

8.8k words

Agentic AI

Analysis of agentic AI capabilities and deployment challenges, documenting industry forecasts (40% of enterprise apps by 2026, $199B market by 2034...

tool-useagenticcomputer-use

Capability

5.8k words

Scientific Research Capabilities

Comprehensive survey of AI scientific research capabilities across biology, chemistry, materials science, and automated research, documenting key b...

alphafolddrug-discoveryscientific-ai

Capability

8.5k words

Large Language Models

Comprehensive analysis of LLM capabilities showing rapid progress from GPT-2 (1.5B parameters, 2019) to GPT-5 and Gemini 2.5 (2025), with training ...

foundation-modelstransformersscaling

Capability

5.0k words

Self-Improvement and Recursive Enhancement

Comprehensive analysis of AI self-improvement from current AutoML systems (23% training speedups via AlphaEvolve) to theoretical intelligence explo...

intelligence-explosionrecursive-self-improvementautoml

Capability

2.7k words

Long-Horizon Autonomous Tasks

METR research shows AI task completion horizons doubling every 7 months (accelerated to 4 months in 2024-2025), with current frontier models achiev...

agenticplanninggoal-stability

Capability

2.8k words

Persuasion and Social Manipulation

GPT-4 achieves superhuman persuasion in controlled settings (64% win rate, 81% higher odds with personalization), with AI chatbots demonstrating 4x...

social-engineeringmanipulationdeception

Capability

2.5k words

Autonomous Coding

AI coding capabilities reached 70-76% on curated benchmarks (23-44% on complex tasks) as of 2025, with 46% of code now AI-written and 55.8% faster ...

software-engineeringcode-generationprogramming-ai

Capability

2.7k words

Collective Intelligence / Coordination

Comprehensive analysis concluding human-only collective intelligence has <1% probability of matching transformative AI, but collective AI architect...

Capability

2.6k words

Biological / Organoid Computing

Comprehensive analysis of biological/organoid computing showing current systems (DishBrain with ~800k neurons, Brainoware at 78% speech recognition...

Capability

2.9k words

Neuro-Symbolic Hybrid Systems

Comprehensive analysis of neuro-symbolic AI systems combining neural networks with formal reasoning, documenting AlphaProof's 2024 IMO silver medal...

Capability

2.2k words

World Models + Planning

Comprehensive analysis of world models + planning architectures showing 10-500x sample efficiency gains over model-free RL (EfficientZero: 194% hum...

Capability

2.5k words

Minimal Scaffolding

Analyzes minimal scaffolding (basic AI chat interfaces) showing 38x performance gap vs agent systems on code tasks (1.96% → 75% on SWE-bench), decl...

Capability

2.0k words

Light Scaffolding

Light scaffolding (RAG, function calling, simple chains) represents the current enterprise deployment standard with 92% Fortune 500 adoption, achie...

Capability

3.6k words

Genetic Enhancement / Selection

Genetic enhancement via embryo selection currently yields 2.5-6 IQ points per generation with 10% variance explained by polygenic scores, while the...

Capability

2.7k words

Sparse / MoE Transformers

Comprehensive reference on Sparse/MoE transformer architectures covering key models (Mixtral, DeepSeek-V3, DBRX, Switch Transformer), efficiency ga...

Capability

4.5k words

Neuromorphic Hardware

Neuromorphic computing achieves 100-1000x energy efficiency over GPUs for sparse inference (Intel Hala Point: 15 TOPS/W) but faces a 15%+ capabilit...

Capability

3.3k words

Novel / Unknown Approaches

Analyzes probability (1-15%) of novel AI paradigms emerging before transformative AI, systematically reviewing historical prediction failures (expe...

Capability

3.5k words

State-Space Models / Mamba

Comprehensive analysis of state-space models (SSMs) like Mamba as transformer alternatives, documenting that Mamba-3B matches Transformer-6B perple...

Capability

3.5k words

Whole Brain Emulation

Comprehensive analysis of whole brain emulation finding <1% probability of arriving before AI-based TAI, with scanning speed (100,000x too slow for...

Capability

3.0k words

Brain-Computer Interfaces

Comprehensive analysis of BCIs concluding they are irrelevant for TAI timelines (<1% probability of dominance) due to fundamental bandwidth constra...

Capability

191 words

Intelligence Paradigms

Different architectures and approaches to building intelligent systems

Capability

2.8k words

AI-Powered Investigation

AI systems can synthesize vast volumes of public data — social media, corporate filings, court records, satellite imagery — to conduct investigativ...

Loading…