Every model, measured.

Start with a research area, drill into a vendor, or page through the full index. Only models with at least one benchmark score appear — a model without a recorded score can’t be ranked.

Vendor:Areas overview speakleash · 253 OpenAI · 85 Google · 71 Qwen · 52 Alibaba · 47 Anthropic · 44 Microsoft · 35 Meta · 30 Mistral · 30 DeepSeek · 28 google · 19 meta-llama · 19 mistralai · 19 Meta AI · 15 CYFRAGOVPL · 14 Zhipu AI · 13 NVIDIA · 10 SpeakLeash · 10 internlm · 10 xAI · 10 ByteDance · 9 Baidu · 8 PLLuM · 8 ibm-granite · 8 microsoft · 8 Amazon · 7 Google DeepMind · 7 MiniMax · 7 Mistral AI · 7 Remek · 7 Shanghai AI Lab · 7 allenai · 7 utter-project · 7 CohereForAI · 6 Microsoft Research · 6 Salesforce · 6 01-ai · 5 Alibaba Cloud · 5 Cohere · 5 Moonshot AI · 5 NousResearch · 5 THUML · 5 deepseek-ai · 5 DeepMind · 4 Facebook AI · 4 IBM · 4 Meituan · 4 Stanford · 4 THUDM · 4 UC San Diego · 4 VikParuchuri · 4 gguf-iq · 4 nvidia · 4 openchat · 4 tiiuae · 4 Allen AI · 3 BAAI · 3 Du et al. · 3 ForgeCode · 3 Fudan University · 3 IDEA Research · 3 Liao et al. · 3 Moonshot.AI · 3 Nam Tuan Ly / NII · 3 OPI-PG · 3 OpenDataLab · 3 ViCoS Lab Ljubljana · 3 Xiaomi · 3 Zhao et al. · 3 gguf · 3 gguf11bv30 · 3 gguf7bv30 · 3 upstage · 3+ 247 smaller vendors (291 models)

§ 01 · Computer Vision models

896 models in Computer Vision · page 5 of 18.

#	Model	Vendor	Parameters	Architecture	SOTA	Benchmarks	Results
201	ViTPose-G	—	—	—	1	1	1
202	VideoMAE ViT-B	—	—	—	1	1	1
203	cascadetabnet	Unknown	Unknown	Unknown	1	1	1
204	dots.mocr	RedNote	3B	Multimodal OCR (3B params)	1	1	1
205	pMF-H + FD-loss	N/A	—	—	1	1	1
206	pil_maskrcnn	ICT, Chinese Academy of Sciences	Unknown	Mask R-CNN based scene text detector	1	1	1
207	Kimi-K2.5	Moonshot.AI	—	—	—	10	16
208	Qwen2.5-VL-72B	—	—	—	—	14	14
209	PAN	Unknown	Unknown	Unknown	—	4	12
210	Qwen3-VL-235B-A22B-Thinking	Qwen	—	—	—	12	12
211	Qwen3-VL-8B-Instruct	Qwen	—	—	—	12	12
212	SPCNET	Unknown	Unknown	Unknown	—	4	12
213	TESTR	Unknown	Unknown	Unknown	—	4	12
214	TextSnake	Unknown	Unknown	Unknown	—	4	12
215	MiniCPM-o 4.5-Instruct	—	—	—	—	11	11
216	Qwen2-VL 7B	Alibaba	7B	—	—	11	11
217	Qwen2-VL-2B	—	—	—	—	10	10
218	ABCNet v2	Unknown	Unknown	Unknown	—	4	9
219	Corner Localization (multi-scale)	Unknown	Unknown	Unknown	—	3	9
220	DeepSeek-Coder-V2-Instruct	DeepSeek	Unknown	MoE Transformer	—	7	9
221	DeepSolo (ResNet-50)	Unknown	Unknown	Unknown	—	4	9
222	FOTS	Unknown	Unknown	Unknown	—	2	9
223	MGP-STR	Unknown	Unknown	Unknown	—	9	9
224	Mask TextSpotter	Unknown	Unknown	Unknown	—	3	9
225	PSENet-1s	Unknown	Unknown	Unknown	—	3	9
226	Qwen2.5-Coder 32B	Alibaba	32B	Dense Transformer	—	8	9
227	RoBERTa	Unknown	Unknown	Unknown	—	9	9
228	SSTD	Unknown	Unknown	Unknown	—	3	9
229	SegLink	Unknown	Unknown	Unknown	—	3	9
230	SwinTextSpotter	Unknown	Unknown	Unknown	—	4	9
231	DBNet++ (ResNet-18) (736)	Unknown	Unknown	Unknown	—	2	8
232	DeiT-B	Meta	86M	Vision Transformer	—	3	8
233	FAST-B-512	Unknown	Unknown	Unknown	—	2	8
234	FAST-B-640	Unknown	Unknown	Unknown	—	2	8
235	FAST-B-736	Unknown	Unknown	Unknown	—	2	8
236	FAST-S-512	Unknown	Unknown	Unknown	—	2	8
237	FAST-S-736	Unknown	Unknown	Unknown	—	2	8
238	GPT-4o mini	OpenAI	—	Multimodal LLM	—	7	8
239	Gemini 3 Flash	Google	Undisclosed	—	—	7	8
240	InternVL2-76B	Shanghai AI Lab	76B	Vision-Language Model	—	5	8
241	Aria	—	—	—	—	7	7
242	BEiT-B	Unknown	Unknown	Unknown	—	2	7
243	DBNet++ (ResNet-18) (800)	Unknown	Unknown	Unknown	—	2	7
244	DBNet++ (ResNet-50) (800)	Unknown	Unknown	Unknown	—	2	7
245	DINOv2 (ViT-g/14)	—	—	—	—	7	7
246	DeepSolo (ResNet-50, TextOCR)	Unknown	Unknown	Unknown	—	3	7
247	DiT-L	Unknown	Unknown	Unknown	—	2	7
248	MANGO	Unknown	Unknown	Unknown	—	3	7
249	MATRN	Research	Unknown	Unknown	—	7	7
250	Mask R-CNN	Meta AI / FAIR	Unknown	Unknown	—	2	7