commonsenseqa.

OCR benchmark

§ 01 · accuracy

accuracy.

Higher is better

#	Model	Score	Source
★	gpt-4o Non-API entry from src	85.4	src
2	claude-35-sonnet Non-API entry from src	83.2	src
3	llama-3-70b Non-API entry from src	80.9	src

§ Related · Explore

Verified Model Reviews

Comparisons & Guides