Neural Neeraj on GPT-5.4 — benchmark.space

YouTube · 2026-03-24

"Reasoning: GPT dominates pure math. Frontier math 47.6% versus Claude's 27.2%. That's a massive gap. But Claude leads on Humanity's Last Exam, 53.1 versus 39.8."

Neural Neeraj

YouTube tech commentator

FrontierMath GPT-5.4

view original source → all researcher takes →