Every model, measured.

Start with a research area, drill into a vendor, or page through the full index. Only models with at least one benchmark score appear — a model without a recorded score can’t be ranked.

Vendor:Areas overview speakleash · 253 OpenAI · 85 Google · 71 Qwen · 52 Alibaba · 47 Anthropic · 44 Microsoft · 35 Meta · 30 Mistral · 30 DeepSeek · 28 google · 19 meta-llama · 19 mistralai · 19 Meta AI · 15 CYFRAGOVPL · 14 Zhipu AI · 13 NVIDIA · 10 SpeakLeash · 10 internlm · 10 xAI · 10 ByteDance · 9 Baidu · 8 PLLuM · 8 ibm-granite · 8 microsoft · 8 Amazon · 7 Google DeepMind · 7 MiniMax · 7 Mistral AI · 7 Remek · 7 Shanghai AI Lab · 7 allenai · 7 utter-project · 7 CohereForAI · 6 Microsoft Research · 6 Salesforce · 6 01-ai · 5 Alibaba Cloud · 5 Cohere · 5 Moonshot AI · 5 NousResearch · 5 THUML · 5 deepseek-ai · 5 DeepMind · 4 Facebook AI · 4 IBM · 4 Meituan · 4 Stanford · 4 THUDM · 4 UC San Diego · 4 VikParuchuri · 4 gguf-iq · 4 nvidia · 4 openchat · 4 tiiuae · 4 Allen AI · 3 BAAI · 3 Du et al. · 3 ForgeCode · 3 Fudan University · 3 IDEA Research · 3 Liao et al. · 3 Moonshot.AI · 3 Nam Tuan Ly / NII · 3 OPI-PG · 3 OpenDataLab · 3 ViCoS Lab Ljubljana · 3 Xiaomi · 3 Zhao et al. · 3 gguf · 3 gguf11bv30 · 3 gguf7bv30 · 3 upstage · 3+ 247 smaller vendors (291 models)

§ 01 · Computer Vision models

896 models in Computer Vision · page 4 of 18.

#	Model	Vendor	Parameters	Architecture	SOTA	Benchmarks	Results
151	TFLOP	Upstage AI	Unknown	Layout Pointer mechanism; span-aware contrastive supervision; reformulates TSR as text region pointing	1	1	2
152	Tesseract	Google (Open Source)	—	Traditional OCR	1	2	2
153	ViT-H/14	Google	632M	Vision Transformer	1	2	2
154	BDN	Unknown	Unknown	Unknown	1	1	1
155	BioRex+Directionality	Unknown	Unknown	Unknown	1	1	1
156	Bluche	Unknown	Unknown	Unknown	1	1	1
157	CDeCNet	Unknown	Unknown	Unknown	1	1	1
158	CNN	Unknown	Unknown	Unknown	1	1	1
159	CNN + BLSTM	Unknown	Unknown	Unknown	1	1	1
160	Co-DETR (Swin-L)	Research	—	Transformer Detector	1	1	1
161	Co-DETR (Swin-L)	Research	Unknown	Collaborative DETR + Swin-L backbone	1	1	1
162	CoCa (ViT-G/14)	Google	2.1B	Contrastive Captioner on ViT-G/14	1	1	1
163	CoCa (finetuned)	Google	2.1B	Contrastive Captioner	1	1	1
164	ConvTextTM	Unknown	Unknown	Unknown	1	1	1
165	DAL	Unknown	Unknown	Unknown	1	1	1
166	DINOv3 + Mask2Former (simple)	—	—	—	1	1	1
167	DINOv3 + Plain-DETR + TTA	—	—	—	1	1	1
168	DOCmT5	Unknown	Unknown	Unknown	1	1	1
169	DiT-L (Cascade)	Unknown	Unknown	Unknown	1	1	1
170	DocFormerv2-Large	Adobe Research	Unknown	Multimodal encoder with spatial-aware cross-attention	1	1	1
171	Document Classification Using Importance of Sentences	Unknown	Unknown	Unknown	1	1	1
172	EAML	Unknown	Unknown	Unknown	1	1	1
173	GCN Hybrid	Unknown	Unknown	Unknown	1	1	1
174	I2L-NOPOOL	Unknown	Unknown	Unknown	1	1	1
175	JDeskew	Unknown	Unknown	Unknown	1	1	1
176	KHCR	Unknown	Unknown	Unknown	1	1	1
177	LayoutLMv3	Unknown	Unknown	Unknown	1	1	1
178	LlamaParse Agentic	LlamaIndex	Unknown	Agentic multi-step LlamaParse pipeline	1	1	1
179	MetaSelf-Learning	Unknown	Unknown	Unknown	1	1	1
180	Oracle-BERT	Unknown	—	oracle-extractive	1	1	1
181	Oracle-BERT (HowSumm-Method)	Unknown	—	—	1	1	1
182	PGNet-A	Unknown	Unknown	Unknown	1	1	1
183	PesRec	Xingwen Cao et al. (LIESMARS, Wuhan University)	—	Multi-task CNN: spatial layout estimator + 3D object detector + mesh generator	1	1	1
184	Proposed System (With post- processing)	Unknown	Unknown	Unknown	1	1	1
185	Q-SENN	Unknown	Unknown	Unknown	1	1	1
186	Query-doc RobeCzech (Roberta-base)	Unknown	Unknown	Unknown	1	1	1
187	REXEL	Unknown	Unknown	Unknown	1	1	1
188	ResNet-RS (ResNet-200 + RS training tricks)	Unknown	Unknown	Unknown	1	1	1
189	SENet	Momenta	—	—	1	1	1
190	STREET	Unknown	Unknown	Unknown	1	1	1
191	ScyllaNet	Scylla Technologies	—	—	1	1	1
192	Seed1.6-vision	ByteDance	—	Vision-Language Model	1	1	1
193	Siamese_MHCA_SA	Unknown	Unknown	Unknown	1	1	1
194	Siamese_MultiHeadCrossAttention_SoftAttention (Siamese_MHCA_SA)	Unknown	Unknown	Unknown	1	1	1
195	StarCoder-LoRA	BigCode / Salesforce	15.5B	Transformer decoder	1	1	1
196	Swin Transformer V2 Large	Microsoft	197M	Hierarchical Vision Transformer	1	1	1
197	TCM	CLIP-based	—	—	1	1	1
198	TabTracer	Unknown	—	—	1	1	1
199	Transformer w/ CNN	Unknown	Unknown	Unknown	1	1	1
200	VGG	Unknown	Unknown	Unknown	1	1	1