humaneval.

OCR benchmark

§ 01 · pass@1

pass@1.

Higher is better

#	Model	Score	Source
★	o4-mini (high) Fetched from CodeSOTA API on 2026-04-20	99.3	codesota-api
2	o3-mini (high) Fetched from CodeSOTA API on 2026-04-20	97.6	codesota-api
3	o4-mini Fetched from CodeSOTA API on 2026-04-20	97.3	codesota-api
4	o3-mini Fetched from CodeSOTA API on 2026-04-20	96.3	codesota-api
5	gpt-41 Fetched from CodeSOTA API on 2026-04-20	94.5	codesota-api
6	GPT-4.1 mini Fetched from CodeSOTA API on 2026-04-20	93.8	codesota-api
7	Qwen2.5-Coder-32B-Instruct Fetched from CodeSOTA API on 2026-04-20	92.7	codesota-api
8	o1-preview Fetched from CodeSOTA API on 2026-04-20	92.4	codesota-api
9	o1-mini Fetched from CodeSOTA API on 2026-04-20	92.4	codesota-api
10	Claude 3.5 Sonnet (Oct 2024) Fetched from CodeSOTA API on 2026-04-20	92.1	codesota-api
11	claude-35-sonnet Fetched from CodeSOTA API on 2026-04-20	92	codesota-api
12	gpt-4o Fetched from CodeSOTA API on 2026-04-20	91	codesota-api
13	GPT-4o (Nov 2024) Fetched from CodeSOTA API on 2026-04-20	90.2	codesota-api
14	llama-31-405b Fetched from CodeSOTA API on 2026-04-20	89	codesota-api
15	gpt-45-preview Fetched from CodeSOTA API on 2026-04-20	88.6	codesota-api
16	grok-2 Fetched from CodeSOTA API on 2026-04-20	88.4	codesota-api
17	Qwen2.5-Coder-7B-Instruct Fetched from CodeSOTA API on 2026-04-20	88.4	codesota-api
18	o3 (high) Fetched from CodeSOTA API on 2026-04-20	88.4	codesota-api
19	gpt-4-turbo Fetched from CodeSOTA API on 2026-04-20	88.2	codesota-api
20	Gemma 3 27B IT Fetched from CodeSOTA API on 2026-04-20	87.8	codesota-api
21	o3 Fetched from CodeSOTA API on 2026-04-20	87.4	codesota-api
22	gpt-4o-mini Fetched from CodeSOTA API on 2026-04-20	87.2	codesota-api
23	GPT-4.1 nano Fetched from CodeSOTA API on 2026-04-20	87	codesota-api
24	Gemma 3 12B IT Fetched from CodeSOTA API on 2026-04-20	85.4	codesota-api
25	DeepSeek-Coder-V2-Instruct Fetched from CodeSOTA API on 2026-04-20	85.4	codesota-api
26	claude-3-opus Fetched from CodeSOTA API on 2026-04-20	84.9	codesota-api
27	Phi-4 (14B) Fetched from CodeSOTA API on 2026-04-20	82.6	codesota-api
28	deepseek-v3 Fetched from CodeSOTA API on 2026-04-20	82.6	codesota-api
29	llama-3-70b Fetched from CodeSOTA API on 2026-04-20	81.7	codesota-api
30	llama-31-70b Fetched from CodeSOTA API on 2026-04-20	80.5	codesota-api
31	gemini-15-pro Fetched from CodeSOTA API on 2026-04-20	71.9	codesota-api
32	Gemma 3 4B IT Fetched from CodeSOTA API on 2026-04-20	71.3	codesota-api
33	DeepSeek-V3 Fetched from CodeSOTA API on 2026-04-20	65.2	codesota-api

§ Related · Explore

humaneval.

pass@1.

More OCR content.