Every model, measured.

Start with a research area, drill into a vendor, or page through the full index. Only models with at least one benchmark score appear — a model without a recorded score can’t be ranked.

Vendor:Areas overview speakleash · 253 OpenAI · 85 Google · 71 Qwen · 52 Alibaba · 47 Anthropic · 44 Microsoft · 35 Meta · 30 Mistral · 30 DeepSeek · 28 google · 19 meta-llama · 19 mistralai · 19 Meta AI · 15 CYFRAGOVPL · 14 Zhipu AI · 13 NVIDIA · 10 SpeakLeash · 10 internlm · 10 xAI · 10 ByteDance · 9 Baidu · 8 PLLuM · 8 ibm-granite · 8 microsoft · 8 Amazon · 7 Google DeepMind · 7 MiniMax · 7 Mistral AI · 7 Remek · 7 Shanghai AI Lab · 7 allenai · 7 utter-project · 7 CohereForAI · 6 Microsoft Research · 6 Salesforce · 6 01-ai · 5 Alibaba Cloud · 5 Cohere · 5 Moonshot AI · 5 NousResearch · 5 THUML · 5 deepseek-ai · 5 DeepMind · 4 Facebook AI · 4 IBM · 4 Meituan · 4 Stanford · 4 THUDM · 4 UC San Diego · 4 VikParuchuri · 4 gguf-iq · 4 nvidia · 4 openchat · 4 tiiuae · 4 Allen AI · 3 BAAI · 3 Du et al. · 3 ForgeCode · 3 Fudan University · 3 IDEA Research · 3 Liao et al. · 3 Moonshot.AI · 3 Nam Tuan Ly / NII · 3 OPI-PG · 3 OpenDataLab · 3 ViCoS Lab Ljubljana · 3 Xiaomi · 3 Zhao et al. · 3 gguf · 3 gguf11bv30 · 3 gguf7bv30 · 3 upstage · 3+ 247 smaller vendors (291 models)

§ 01 · Computer Vision models

896 models in Computer Vision · page 6 of 18.

#	Model	Vendor	Parameters	Architecture	SOTA	Benchmarks	Results
251	Massively Multilingual Sentence Embeddings	Unknown	Unknown	Unknown	—	7	7
252	MultiCCA + CNN	Unknown	Unknown	Unknown	—	7	7
253	PARSeq	Research	Unknown	Scene Text Recognition with Permuted Autoregressive Sequence Models	—	6	7
254	SRFormer (ResNet-50)	Unknown	Unknown	Unknown	—	3	7
255	VideoLLaMA3 7B	—	—	—	—	7	7
256	pre-train w/ code only	Unknown	Unknown	Unknown	—	7	7
257	seq2seq	Unknown	Unknown	Unknown	—	7	7
258	CDistNet (Ours)	Unknown	Unknown	Unknown	—	6	6
259	CRNN	Unknown	Unknown	Unknown	—	5	6
260	CharNet H-88	Unknown	Unknown	Unknown	—	2	6
261	CharNet H-88 (multi-scale)	Unknown	Unknown	Unknown	—	2	6
262	DPAN	Unknown	Unknown	Unknown	—	6	6
263	DiffusionSTR	Unknown	Unknown	Unknown	—	6	6
264	EK-Net	Zhu et al.	Unknown	ResNet-18 + Expand Kernel Distance	—	2	6
265	FOTS MS	Unknown	Unknown	Unknown	—	2	6
266	FTSN + MNMS	Unknown	Unknown	Unknown	—	2	6
267	GLAM	Unknown	Unknown	Unknown	—	1	6
268	GNNets	Unknown	Unknown	Unknown	—	2	6
269	HTR-ConvText	DAIR-Group	65.9M	CNN+Transformer hybrid (ConvText block)	—	3	6
270	HTR-VT	Unknown	Unknown	Unknown	—	3	6
271	InternVL3-78B	Shanghai AI Lab	78B	Vision-Language Model	—	5	6
272	LayoutLMv3-B	Unknown	Unknown	Unknown	—	1	6
273	PAN-640	Unknown	Unknown	Unknown	—	2	6
274	PixelLink+VGG16 2s	Unknown	Unknown	Unknown	—	2	6
275	ResNext-101-32×8d	Unknown	Unknown	Unknown	—	1	6
276	S-GTR	Unknown	Unknown	Unknown	—	6	6
277	SLPR	Unknown	Unknown	Unknown	—	2	6
278	TextBPN++ (ResNet-50+DCN)	Zhang et al.	Unknown	ResNet-50 with Deformable Convolution + Boundary Transformer	—	2	6
279	TrOCR-base 334M	Unknown	Unknown	Unknown	—	6	6
280	TrOCR-large 558M	Unknown	Unknown	Unknown	—	6	6
281	UDoc	Unknown	Unknown	Unknown	—	1	6
282	VAN	Unknown	Unknown	Unknown	—	3	6
283	VideoLLaMA3 2B	—	—	—	—	6	6
284	WordSup (VGG16-synth-icdar)	Unknown	Unknown	Unknown	—	2	6
285	ABINet-LV	Fang et al.	Unknown	ResNet + Bidirectional Language Model (LV)	—	5	5
286	BART-base (STSM)	Meta	139M	Transformer	—	1	5
287	CodeBERT (RTD)	Unknown	Unknown	Unknown	—	5	5
288	DPText-DETR (ResNet-50)	Unknown	Unknown	Unknown	—	2	5
289	FLAN-T5-base (STSM)	Google	250M	Transformer	—	1	5
290	FactJointGT	Unknown	Unknown	Unknown	—	1	5
291	GLASS	Unknown	Unknown	Unknown	—	2	5
292	GPT-2-Medium (fine-tuning)	OpenAI	355M	Transformer	—	1	5
293	HTLM (prefix-tuning)	Unknown	Unknown	Transformer	—	1	5
294	JointGT Baseline	Unknown	Unknown	Unknown	—	1	5
295	MaskTextSpotter v3	Unknown	Unknown	Unknown	—	2	5
296	MiniCPM-Llama3-V 2.5	—	—	—	—	5	5
297	MiniCPM-V 4.6-Thinking (16x)	—	—	—	—	5	5
298	Qwen2.5-VL 72B	Alibaba	72B	Vision-Language Model	—	5	5
299	SIGA_T	Unknown	Unknown	Unknown	—	5	5
300	SPTS v2	Unknown	Unknown	Unknown	—	2	5