strategyqa.

OCR benchmark

§ 01 · accuracy

accuracy.

Higher is better

#	Model	Score	Source
★	gpt-4o Non-API entry from src	82.1	src
2	claude-35-sonnet Non-API entry from src	79.8	src

§ Related · Explore

Verified Model Reviews

Comparisons & Guides