Neural Neeraj on GPT-5.4 — benchmark.space

YouTube · 2026-03-24

"Frontier math 47.6% versus Claude's 27.2. That's a massive gap. But Claude leads on humanity's last exam, 53.1 versus 39.8."

Neural Neeraj

YouTube AI analyst