Every model, measured.

Start with a research area, drill into a vendor, or page through the full index. Only models with at least one benchmark score appear — a model without a recorded score can’t be ranked.

Vendor:Areas overview speakleash · 253 OpenAI · 85 Google · 71 Qwen · 52 Alibaba · 47 Anthropic · 44 Microsoft · 35 Meta · 30 Mistral · 30 DeepSeek · 28 google · 19 meta-llama · 19 mistralai · 19 Meta AI · 15 CYFRAGOVPL · 14 Zhipu AI · 13 NVIDIA · 10 SpeakLeash · 10 internlm · 10 xAI · 10 ByteDance · 9 Baidu · 8 PLLuM · 8 ibm-granite · 8 microsoft · 8 Amazon · 7 Google DeepMind · 7 MiniMax · 7 Mistral AI · 7 Remek · 7 Shanghai AI Lab · 7 allenai · 7 utter-project · 7 CohereForAI · 6 Microsoft Research · 6 Salesforce · 6 01-ai · 5 Alibaba Cloud · 5 Cohere · 5 Moonshot AI · 5 NousResearch · 5 THUML · 5 deepseek-ai · 5 DeepMind · 4 Facebook AI · 4 IBM · 4 Meituan · 4 Stanford · 4 THUDM · 4 UC San Diego · 4 VikParuchuri · 4 gguf-iq · 4 nvidia · 4 openchat · 4 tiiuae · 4 Allen AI · 3 BAAI · 3 Du et al. · 3 ForgeCode · 3 Fudan University · 3 IDEA Research · 3 Liao et al. · 3 Moonshot.AI · 3 Nam Tuan Ly / NII · 3 OPI-PG · 3 OpenDataLab · 3 ViCoS Lab Ljubljana · 3 Xiaomi · 3 Zhao et al. · 3 gguf · 3 gguf11bv30 · 3 gguf7bv30 · 3 upstage · 3+ 247 smaller vendors (291 models)

§ 01 · Computer Vision models

896 models in Computer Vision · page 2 of 18.

#	Model	Vendor	Parameters	Architecture	SOTA	Benchmarks	Results
051	MultiFiT, pseudo	Unknown	Unknown	Unknown	2	7	7
052	PMTD*	Unknown	Unknown	Unknown	2	2	6
053	FactT5B	Unknown	Unknown	Unknown	2	1	5
054	GPT-2-Large (prefix-tuning)	OpenAI	774M	Transformer	2	1	5
055	clearOCR	TeamQuest	—	Traditional OCR	2	1	5
056	HTR-VT(line-level)	Unknown	Unknown	Unknown	2	2	4
057	AIMv2 ViT-3B/14 448px	—	—	—	2	3	3
058	DnC-SC	Unknown	Unknown	Unknown	2	1	3
059	GLM-OCR	Zhipu AI	—	—	2	2	3
060	HDLTex	Unknown	Unknown	Unknown	2	3	3
061	Hierarchical Table Recognizer	Takaya Kawakatsu	—	—	2	1	3
062	Holistic	Unknown	Unknown	Unknown	2	1	3
063	KD-LSTMreg	Unknown	Unknown	Unknown	2	3	3
064	RetinaNet	Unknown	Unknown	Unknown	2	2	3
065	Scrambled code + broken (alter)	Unknown	Unknown	Unknown	2	1	3
066	Vision Transformer (ViT-H/14)	—	—	—	2	3	3
067	ABINet-LV+TPS++	Unknown	Unknown	Unknown	2	2	2
068	Accurate Content Copying	—	—	—	2	1	2
069	Bert	Unknown	Unknown	Unknown	2	2	2
070	Biinclusion (Euro500kReuters)	Unknown	Unknown	Unknown	2	2	2
071	BilBOWA	Unknown	Unknown	Unknown	2	2	2
072	CLIP4STR-H (DFN-5B)	Unknown	Unknown	Unknown	2	2	2
073	CV-Group	Unknown	Unknown	Unknown	2	1	2
074	ChuLo	Unknown	Unknown	Unknown	2	2	2
075	DINO-X	IDEA Research	Unknown	Unified vision model with DINO-based detection head + large language model	2	1	2
076	DeepPyramidion	Unknown	Unknown	Unknown	2	2	2
077	HunyuanOCR (1B)	Unknown	—	—	2	2	2
078	JSTR	Fujitake	Unknown	DTrOCR + judgment module for image-text matching to reduce misrecognition	2	2	2
079	MPAD-path	Unknown	Unknown	Unknown	2	2	2
080	OmniParser	Alibaba	—	Unified framework: text spotting, KIE, table recognition	2	1	2
081	PyLaia (human transcriptions + random split)	Unknown	Unknown	Unknown	2	1	2
082	SSD512 (VGG-16)	Google / UNC	~27M	Single-shot multibox detector with VGG-16 backbone, 512x512 input	2	1	2
083	VTM	Unknown	Unknown	Unknown	2	1	2
084	VaeDiff-DocRE	Unknown	Unknown	Unknown	2	2	2
085	VisualWordGrid	Unknown	Unknown	Unknown	2	1	2
086	XLNet	Unknown	Unknown	Unknown	2	1	2
087	Gemini 3 Pro	Google	Undisclosed	—	1	11	13
088	MixNet	Unknown	Unknown	Unknown	1	4	13
089	CLIP4STR-B	Research	Unknown	Unknown	1	12	12
090	Qwen3-VL-235B-A22B-Instruct	Qwen	—	—	1	12	12
091	Corner-based Region Proposals	Unknown	Unknown	Unknown	1	3	9
092	olmOCR v0.4.0	Allen AI	—	OCR Pipeline	1	1	9
093	DoPTA	Unknown	Unknown	Unknown	1	3	8
094	FAST-T-736	Unknown	Unknown	Unknown	1	2	8
095	A3S	Unknown	Unknown	Unknown	1	3	7
096	CodeBERT (MLM)	Unknown	Unknown	Unknown	1	7	7
097	CodeBERT (MLM+RTD)	Unknown	Unknown	Unknown	1	7	7
098	SPTS	Unknown	Unknown	Unknown	1	3	7
099	CPPD	Unknown	Unknown	Unknown	1	6	6
100	Intern-S1-Pro	Shanghai AI Lab	—	—	1	5	6