Who leads the MMMU-Pro benchmark?

Gemini-3.1-Pro currently leads MMMU-Pro with a score of 82 on Accuracy.

What is the state-of-the-art score on MMMU-Pro?

The state-of-the-art result on MMMU-Pro is 82 (Accuracy), achieved by Gemini-3.1-Pro as of 2026.

How many models are tracked on MMMU-Pro?

Codesota tracks 31 models on MMMU-Pro.

When was the MMMU-Pro leaderboard last updated?

The MMMU-Pro leaderboard on Codesota includes results through 2026, with the earliest tracked result from 2024.

MMMU-Pro Leaderboard | CodeSOTA

§ 02 · Leaderboard

Results by metric.

Found a wrong score or missing run?

Use row edits to send a sourced correction into moderation.

Add / edit result ↗Report issue ↗

Accuracy

Accuracy is the reported evaluation metric for MMMU-Pro. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for Accuracyverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	Gemini-3.1-Pro	verified	82	2026	Source ↗	Looks wrong?
02	GPT-5.2	verified	81	2025	Source ↗	Looks wrong?
03	Gemini 3 Pro	verified	80	2026	Source ↗	Looks wrong?
04	Kimi K2.6	unverified	79.4	2026	Paper ↗	Looks wrong?
05	Qwen3.5-397B-A17B	unverified	79	2026	Paper ↗Code ↗	Looks wrong?
06	Kimi-K2.5	unverified	78.5	2026	Paper ↗Code ↗	Looks wrong?
07	Qwen3.5-122B-A10B	unverified	76.9	2026	Paper ↗Code ↗Source ↗	Looks wrong?
08	Gemma 4 31B	unverified	76.9	2026	Paper ↗	Looks wrong?
09	GPT-5.1	verified	76.5	2025	Source ↗	Looks wrong?
10	Qwen3.6-27B	unverified	75.8	2026	Paper ↗Code ↗	Looks wrong?
11	Qwen3.6-35B-A3B	unverified	75.3	2026	Paper ↗Code ↗	Looks wrong?
12	Qwen3.5-35B-A3B	unverified	75.1	2026	Paper ↗Code ↗Source ↗	Looks wrong?
13	Qwen3.5-27B	unverified	75	2026	Paper ↗Code ↗Source ↗	Looks wrong?
14	Qwen3.5-Omni-Plus	unverified	73.9	2026	Paper ↗	Looks wrong?
15	Qwen3.6 Plus	verified	73.8	2026	Source ↗	Looks wrong?
16	SenseNova-U1-A3B-MoT	unverified	72.83	2026	Paper ↗Code ↗	Looks wrong?
17	Intern-S1-Pro	unverified	72.8	2026	Paper ↗Source ↗	Looks wrong?
18	Qwen3-VL-235B-A22B-Thinking	unverified	69.3	2025	Paper ↗Code ↗	Looks wrong?
19	Qwen3-VL-235B-A22B-Instruct	unverified	68.1	2025	Paper ↗Code ↗	Looks wrong?
20	Qwen3-Omni-Flash-Thinking	unverified	60.8	2025	Paper ↗Code ↗	Looks wrong?
21	Qwen3-VL-8B-Instruct	unverified	55.9	2025	Paper ↗Code ↗	Looks wrong?
22	Ovis2.5-9B	unverified	54.4	2025	Paper ↗Code ↗	Looks wrong?
23	MiniMax-VL-01	unverified	52.7	2025	Paper ↗Code ↗	Looks wrong?
24	Qwen2.5-VL-72B	unverified	51.1	2025	Paper ↗Code ↗	Looks wrong?
25	Kimi-VL-A3B-Thinking-2506	unverified	46.3	2025	Paper ↗Code ↗	Looks wrong?
26	Qwen2-VL 72B	unverified	46.2	2024	Paper ↗Code ↗	Looks wrong?
27	Qwen2-VL 7B	unverified	43.5	2024	Paper ↗Code ↗	Looks wrong?
28	Qwen2-VL-2B	unverified	37.6	2024	Paper ↗Code ↗	Looks wrong?
29	VideoLLaMA3 7B	unverified	33.6	2025	Paper ↗Code ↗	Looks wrong?
30	MiniCPM-V 4.6-Thinking (16x)	unverified	32.5	2026	Paper ↗	Looks wrong?
31	VideoLLaMA3 2B	unverified	28.6	2025	Paper ↗Code ↗	Looks wrong?

MMMU-Pro.

Year over year.

Results by metric.

Accuracy

MMMU-Pro in context.

Add to the leaderboard.