math.

OCR benchmark

§ 01 · accuracy

accuracy.

Higher is better

#	Model	Score	Source
★	o4-mini (high) Non-API entry from src	98.2	src
2	o3 (high) Non-API entry from src	98.1	src
3	o3-mini Non-API entry from src	97.9	src
4	o3 Non-API entry from src	97.8	src
5	o4-mini Non-API entry from src	97.5	src
6	DeepSeek-R1 Non-API entry from src	97.3	src
7	Gemini 2.5 Pro Non-API entry from src	97.3	src
8	o1 Non-API entry from src	96.4	src
9	Claude 3.7 Sonnet Non-API entry from src	96.2	src
10	Kimi k1.5 Non-API entry from src	96.2	src
11	DeepSeek-R1-Zero Non-API entry from src	95.9	src
12	DeepSeek-R1-Distill-Llama-70B Non-API entry from src	94.5	src
13	DeepSeek-R1-Distill-Qwen-32B Non-API entry from src	94.3	src
14	DeepSeek-V3-0324 Non-API entry from src	94	src
15	QwQ-32B Non-API entry from src	90.6	src
16	deepseek-v3 Non-API entry from src	90.2	src
17	o1-mini Non-API entry from src	90	src
18	GPT-4.5 Preview Non-API entry from src	87.1	src
19	o1-preview Non-API entry from src	85.5	src
20	GPT-4.1 Non-API entry from src	82.1	src
21	gpt-4o Non-API entry from src	76.6	src
22	Grok 2 Non-API entry from src	76.1	src
23	Llama 3.1 405B Non-API entry from src	73.8	src
24	GPT-4 Turbo Non-API entry from src	73.4	src
25	claude-35-sonnet Non-API entry from src	71.1	src
26	gpt-4o-mini Non-API entry from src	70.2	src
27	Llama 3.1 70B Non-API entry from src	68	src
28	gemini-15-pro Non-API entry from src	67.7	src
29	Claude 3 Opus Non-API entry from src	60.1	src

§ Related · Explore