MMMLU Leaderboard 2026 — Results Across 5 Real AI Models

MMMLU leaderboard

MMMLU

5 models tested · Updated 2026-04-07 · Verified sources only

      Claude Opus 4.6 leads at 91.1%
    

Anthropic · arxiv/Mythos-System-Card · 2026-04-07

Multilingual MMLU. Slightly below Gemini 3.1 Pro (92.6-93.6%).

91.1%

Massive multilingual MMLU. 30.7B dense.

88.4%

MoE 25.2B total, 3.8B active.

86.3%

4.5B effective params.

76.6%

2.3B effective params.

67.4%