Every model, measured.

Start with a research area, drill into a vendor, or page through the full index. Only models with at least one benchmark score appear — a model without a recorded score can’t be ranked.

Vendor:Areas overview Unknown · 509 speakleash · 253 OpenAI · 75 Google · 67 Research · 52 Qwen · 47 Alibaba · 43 Anthropic · 40 Microsoft · 34 Mistral · 30 Meta · 29 DeepSeek · 25 google · 19 meta-llama · 19 mistralai · 19 Meta AI · 15 Academic · 14 CYFRAGOVPL · 14 Zhipu AI · 12 SpeakLeash · 10 internlm · 10 xAI · 10 ByteDance · 9 Baidu · 8 PLLuM · 8 ibm-granite · 8 microsoft · 8 · 7 Alibaba Cloud · 7 Google DeepMind · 7 Remek · 7 allenai · 7 utter-project · 7 CohereForAI · 6 Microsoft Research · 6 MiniMax · 6 NVIDIA · 6 Salesforce · 6 Shanghai AI Lab · 6 01-ai · 5 Amazon · 5 Mistral AI · 5 Moonshot AI · 5 NousResearch · 5 THUML · 5 deepseek-ai · 5 Cohere · 4 DeepMind · 4 Facebook AI · 4 Meituan · 4 Stanford · 4 THUDM · 4 UC San Diego · 4 VikParuchuri · 4 gguf-iq · 4 nvidia · 4 openchat · 4 tiiuae · 4 Allen AI · 3 BAAI · 3 Du et al. · 3 Fudan University · 3 IDEA Research · 3 Liao et al. · 3 Moonshot.AI · 3 Nam Tuan Ly / NII · 3 OPI-PG · 3 OpenDataLab · 3 ViCoS Lab Ljubljana · 3 Xiaomi · 3 Zhao et al. · 3 gguf · 3 gguf11bv30 · 3 gguf7bv30 · 3 upstage · 3 347yth03847tyhy03847yt · 2 AAAI 2024 · 2 Castorini (Waterloo) · 2 Fang et al. · 2 German Cancer Research Center (DKFZ) · 2 Google / UNC · 2 HIT & iFLYTEK · 2 HuggingFaceH4 · 2 IBM Research · 2 Independent · 2 Jina AI · 2 Liao et al. (USTC) · 2 LlamaIndex · 2 Meta AI / FAIR · 2 MiniMaxAI · 2 MonkeyOCR · 2 NVIDIA (MONAI) · 2 Nanjing University · 2 Nanonets · 2 Nexusflow · 2 Nondzu · 2 OpenGVLab · 2 RedNote HILab · 2 Sarvam AI · 2 Simular AI · 2 Su et al. · 2 TeeZee · 2 Ultralytics · 2 University of Leicester · 2 Voicelab · 2 Wan et al. (Baidu) · 2 Zhang et al. · 2 Zheng et al. · 2 Ziyan Huang et al. · 2 alpindale · 2 cjvt · 2 h2oai · 2 meditsolutions · 2 openGPT-X · 2 teknium · 2 AAAI 2020 · 1 AAAI 2023 · 1 Adobe Research · 1 Alibaba Qwen · 1 Alibaba iDST · 1 Alibaba/Qwen · 1 Amazon Web Services · 1 Anonymous (ECCV 2024) · 1 Anonymous (arXiv 2023) · 1 Anonymous (arXiv 2025) · 1 Anonymous / ACL community · 1 Anonymous / arxiv preprint · 1 Anysphere · 1 Apple · 1 AssemblyAI · 1 Audio Research · 1 BAAI (Beijing Academy of AI) · 1 BAAI / PKU · 1 BRIDO Authors · 1 Baidu PaddlePaddle · 1 Baidu Qianfan · 1 BigCode · 1 BigCode / Salesforce · 1 Biology · 1 CASIA / UCAS · 1 CLIP-based · 1 CMU · 1 CUHK / HIT · 1 CVPR 2019 · 1 CVPR 2020 · 1 CVPR 2021 · 1 CW · 1 Case Western Reserve University · 1 ChatDoc · 1 Chen et al. · 1 Chen et al. (JHU) · 1 Chen, Zhang et al. · 1 Cheng et al. · 1 Cognition · 1 Cohen Lab · 1 CohereLabs · 1 Columbia University · 1 Community · 1 Coqui AI · 1 DAIR-Group · 1 DCASE · 1 DFKI / TU Kaiserslautern · 1 DMLC · 1 DeepL SE · 1 DeepMind / TU Warsaw · 1 ETH Zurich · 1 East China Normal University · 1 Edresson Casanova et al. · 1 Emergence AI · 1 Extend · 1 FAIR & UW · 1 FSOFT AI Lab · 1 Fudan University / Alibaba · 1 Fujitake · 1 Georgia Tech (Peng et al.) · 1 Ghent University · 1 Google (Open Source) · 1 Google AI · 1 Google Brain · 1 Google Cloud · 1 Google Research · 1 Google/CMU · 1 Hanvon_WuHan · 1 Harvard/MIT · 1 Hikvision Research Institute · 1 Huawei · 1 HuggingFaceTB · 1 ICCV 2019 · 1 ICT, Chinese Academy of Sciences · 1 IDEA-Research · 1 IFLYTEK / USTC (Zhang et al.) · 1 IIT Bombay LEAP-OCR · 1 IJCAI 2025 · 1 JD Explore Academy · 1 JaidedAI · 1 Jiahao Lyu et al., Fudan University · 1 Jiang et al. · 1 KAIST · 1 KAIST / NAVER · 1 Kakao · 1 Kim et al. · 1 Knowledgator · 1 LGAI-EXAONE · 1 LandingAI · 1 Layer 6 AI · 1 LightOn · 1 Longhuang Wu et al. · 1 MBZUAI · 1 Meta AI / UIUC · 1 Meta AI / WSU · 1 Microsoft STCA AIC · 1 Mila · 1 Mila / Intel · 1 Mila / Valence · 1 Momenta · 1 MultiOn · 1 NEC / UIUC · 1 NUS · 1 NVIDIA / NeMo · 1 NVIDIA / Suno · 1 NYU · 1 NYU / Google · 1 Nixtla · 1 Oxford / Twitter · 1 PAII Insight Team · 1 PJLab & Tsinghua · 1 Ping An Life Insurance · 1 PriorLabs (University of Freiburg) · 1 RedNote · 1 Reducto · 1 Research (IDEA Research) · 1 SFU · 1 SJTU · 1 SUTD · 1 Saifullah et al. · 1 Scylla Technologies · 1 SenseTime · 1 Sensetime / Sense-X · 1 Sentence-Transformers · 1 ServiceNow · 1 ServiceNow-AI · 1 Sogou OCR team · 1 SonarSource · 1 Stanford ML Group · 1 Stanford NLP · 1 StepFun · 1 Studio Ousia · 1 SumHiS Authors · 1 TPAMI 2021 · 1 TPAMI 2022 · 1 Takaya Kawakatsu · 1 TeamQuest · 1 TildeAI · 1 Timm · 1 Tongji University / Ant Group · 1 TriSum Authors · 1 Tsinghua · 1 Tsinghua / MEGVII · 1 Tsinghua / MILA · 1 Tsinghua University · 1 Tsinghua University / Baidu · 1 U. Toronto · 1 UBTECH · 1 UC Berkeley · 1 UC Davis · 1 UCLA / Columbia · 1 UCLA / Columbia University · 1 USTC / Microsoft Research Asia · 1 UTTER · 1 UW-Madison / Microsoft · 1 Uber AI · 1 Uber Technologies · 1 University Medical Center Hamburg-Eppendorf et al. · 1 Unknown (ICDAR 2021 participant) · 1 Upstage AI · 1 Verified XiaoPAI · 1 ViTAE-Transformer · 1 Voyage AI · 1 Wang et al. (University of Toronto) · 1 Weizmann Institute · 1 Xing et al. · 1 Xingwen Cao et al. (LIESMARS, Wuhan University) · 1 Yale NLP · 1 Yan et al. · 1 Yongkun Du et al. · 1 Zhang et al. (HCIILAB) · 1 Zhong and Gao · 1 Zhou et al. · 1 Zhu et al. · 1 berkeley-nest · 1 community · 1 datalab-to · 1 deepcogito · 1 djstrong · 1 dnhkng · 1 dreamgen · 1 jxm · 1 lex-hue · 1 lmsys · 1 mlabonne · 1 moonshotai · 1 openai · 1 piotr-ai · 1 scikit-learn · 1 swiss-ai · 1 szymonrucinski · 1

§ 01 · Computer Vision models

768 models in Computer Vision · page 15 of 16.

#	Model	Vendor	Parameters	Architecture	SOTA	Benchmarks	Results
701	STaR-8B	Unknown	—	—	—	1	1
702	SVTR-B (Base)	Unknown	Unknown	Unknown	—	1	1
703	SVTR-L (Large)	Unknown	Unknown	Unknown	—	1	1
704	SVTR-S (Small)	Unknown	Unknown	Unknown	—	1	1
705	SVTR-T (Tiny)	Unknown	Unknown	Unknown	—	1	1
706	SVTRv2-B	Du et al.	Unknown	SVTR Base + Multi-Size Resizing + Feature Rearrangement + Semantic Guidance (CTC)	—	1	1
707	SVTRv2-S	Du et al.	Unknown	SVTR Small + Multi-Size Resizing + Feature Rearrangement + Semantic Guidance (CTC)	—	1	1
708	SVTRv2-T	Du et al.	Unknown	SVTR Tiny + Multi-Size Resizing + Feature Rearrangement + Semantic Guidance (CTC)	—	1	1
709	SciFive-large	Unknown	Unknown	Unknown	—	1	1
710	SenseTime Basemodel	SenseTime	—	—	—	1	1
711	Siamese Small-E-Czech (Electra-small)	Unknown	Unknown	Unknown	—	1	1
712	SigNet-F (SVM)	Unknown	Unknown	Unknown	—	1	1
713	SoViT-400M/14	Google	400M	Compute-optimal ViT shape	—	1	1
714	SoViT-400m/14	Google DeepMind	400M	Vision Transformer (Shape-Optimized)	—	1	1
715	StrucTexTv2 (large)	Unknown	Unknown	Unknown	—	1	1
716	Surya	VikParuchuri	—	—	—	1	1
717	Swin Transformer Large	Microsoft	197M	Hierarchical Vision Transformer	—	1	1
718	Swin-L (Cascade R-CNN)	Microsoft Research	—	—	—	1	1
719	Swin-L + UperNet	Microsoft	Unknown	Swin Transformer Large backbone + UperNet head	—	1	1
720	T-REX (Phi-4)	Unknown	—	—	—	1	1
721	TILT-Base	Unknown	Unknown	Unknown	—	1	1
722	TILT-Large	Unknown	Unknown	Unknown	—	1	1
723	TSRFormer	Unknown	Unknown	Unknown	—	1	1
724	Tab-PoT	Unknown	Unknown	Unknown	—	1	1
725	TabSQLify (col+row)	Unknown	Unknown	Unknown	—	1	1
726	TableNet	Unknown	Unknown	Unknown	—	1	1
727	TextBlockV2 (GPT-2)	Jiahao Lyu et al., Fudan University	Unknown	GPT-2 LM decoder for detection-free scene text spotting	—	1	1
728	TextCohesion	Unknown	Unknown	Unknown	—	1	1
729	TextMonkey	Huawei	—	—	—	1	1
730	Thinker	UBTECH	—	—	—	1	1
731	TrOCR-small 62M	Unknown	Unknown	Unknown	—	1	1
732	TransOCR	Unknown	Unknown	Unknown	—	1	1
733	Transfer Learning from AlexNet, VGG-16, GoogLeNet and ResNet50	Unknown	Unknown	Unknown	—	1	1
734	Transfer Learning from VGG16 trained on Imagenet	Unknown	Unknown	Unknown	—	1	1
735	TransferDoc	Unknown	Unknown	Unknown	—	1	1
736	Transformer + CNN	Unknown	Unknown	Unknown	—	1	1
737	Transformer w/ CNN (+synth)	Unknown	Unknown	Unknown	—	1	1
738	USM (COCO TS + ICDAR–2013)	Unknown	Unknown	Unknown	—	1	1
739	UniTabNet	Anonymous / ACL community	Unknown	Vision-language model bridging image encoder and text decoder for table structure parsing	—	1	1
740	VLAWE	Unknown	Unknown	Unknown	—	1	1
741	VLCDoC	Unknown	Unknown	Unknown	—	1	1
742	ViT-22B/14	Google	22B	Scaled Vision Transformer 22B	—	1	1
743	ViT-Adapter-L	Nanjing University	—	—	—	1	1
744	ViT-G/14	Google	1.8B	Vision Transformer	—	1	1
745	ViT-L/16	Google	307M	Vision Transformer	—	1	1
746	ViTDet-H	Meta AI	Unknown	Plain ViT-Huge + Cascade Mask R-CNN	—	1	1
747	YOLO11x	Ultralytics	Unknown	YOLO v11 Extra-Large	—	1	1
748	YOLOv8-DocLayNet	Research	Unknown	YOLOv8 fine-tuned on DocLayNet	—	1	1
749	coatnet_2_rw_224.sw_in12k_ft_in1k	Google	—	CoAtNet-2 RW, IN12K -> IN1K fine-tune	—	1	1
750	convnext_base.fb_in22k_ft_in1k	Meta AI	—	ConvNeXt-B, IN22K pre-train, IN1K fine-tune	—	1	1