Codesota · Benchmark · ICDAR 2015Home/Leaderboards/Vision & Documents/Scene Text Detection/ICDAR 2015

Unknown

ICDAR 2015.

1000 training + 500 test images captured with wearable cameras. Industry standard for scene text detection.

Paper ↗Leaderboard ↓

§ 01 · SOTA history

Year over year.

§ 02 · Leaderboard

Results by metric.

Found a wrong score or missing run?

Use row edits to send a sourced correction into moderation.

Add / edit result ↗Report issue ↗

precision

Precision is the reported evaluation metric for ICDAR 2015. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for precisionverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	93.96	2020	Paper ↗Code ↗	Looks wrong?
02	CharNet H-88 (multi-scale) From paper: Convolutional Character Networks	verified	92.65	2019	Paper ↗Code ↗	Looks wrong?
03	SBD From paper: Exploring the Capacity of an Orderless Box Discretization Network for Multi-orientation Scene Text Detection	verified	92.1	2019	Paper ↗Code ↗	Looks wrong?
04	EK-Net EK-Net (Expand Kernel Network), arXiv Jan 2024. ResNet-18 backbone at 35.42 FPS. arxiv:2401.11704.	paper	92	2024	Source ↗	Looks wrong?
05	FOTS MS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	91.85	2018	Paper ↗Code ↗	Looks wrong?
06	DB-ResNet-50 (1152) From paper: Real-time Scene Text Detection with Differentiable Binarization	verified	91.8	2019	Paper ↗Code ↗	Looks wrong?
07	Mask TextSpotter From paper: Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes	verified	91.6	2018	Paper ↗Code ↗	Looks wrong?
08	CharNet H-57 (multi-scale) From paper: Convolutional Character Networks	verified	91.43	2019	Paper ↗Code ↗	Looks wrong?
09	PMTD* From paper: Pyramid Mask Text Detector	verified	91.3	2019	Paper ↗Code ↗	Looks wrong?
10	CharNet H-50 (single-scale) From paper: Convolutional Character Networks	verified	91.15	2019	Paper ↗Code ↗	Looks wrong?
11	FOTS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	91	2018	Paper ↗Code ↗	Looks wrong?
12	DBNet++ (ResNet-50) (1152) From paper: Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion	verified	90.9	2022	Paper ↗Code ↗	Looks wrong?
13	CharNet H-50 (multi-scale) From paper: Convolutional Character Networks	verified	90.9	2019	Paper ↗Code ↗	Looks wrong?
14	GNNets From paper: Geometry Normalization Networks for Accurate Scene Text Detection	verified	90.41	2019	Paper ↗Code ↗	Looks wrong?
15	TESTR TESTR (Text Spotting Transformers), CVPR 2022. Detection-only F-measure on ICDAR 2015 test set without lexicon. arxiv:2204.01918.	unverified	90.31	2022	Source ↗	Looks wrong?
16	DBNet++ (ResNet-18) (736) From paper: Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion	verified	90.1	2022	Paper ↗Code ↗	Looks wrong?
17	CharNet H-88 (single-scale) From paper: Convolutional Character Networks	verified	89.99	2019	Paper ↗Code ↗	Looks wrong?
18	CRAFT From paper: Character Region Awareness for Text Detection	verified	89.8	2019	Paper ↗Code ↗	Looks wrong?
19	FAST-B-1280 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	89.7	2021	Paper ↗Code ↗	Looks wrong?
20	Corner Localization (multi-scale) From paper: Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation	verified	89.5	2018	Paper ↗Code ↗	Looks wrong?
21	FAST-B-896 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	89.2	2021	Paper ↗Code ↗	Looks wrong?
22	CharNet H-57 (single-scale) From paper: Convolutional Character Networks	verified	88.88	2019	Paper ↗Code ↗	Looks wrong?
23	Corner-based Region Proposals From paper: Detecting Multi-Oriented Text with Corner-based Region Proposals	verified	88.7	2018	Paper ↗Code ↗	Looks wrong?
24	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	88.7	2018	Paper ↗Code ↗	Looks wrong?
25	FTSN + MNMS From paper: Fused Text Segmentation Networks for Multi-oriented Scene Text Detection	verified	88.6	2017	Paper ↗	Looks wrong?
26	FAST-B-736 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	88	2021	Paper ↗Code ↗	Looks wrong?
27	Quad_MS From paper: TextBoxes++: A Single-Shot Oriented Scene Text Detector	verified	87.8	2018	Paper ↗Code ↗	Looks wrong?
28	PSENet-1s From paper: Shape Robust Text Detection with Progressive Scale Expansion Network	verified	86.9	2019	Paper ↗Code ↗Source ↗	Looks wrong?
29	SAST From paper: A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning	verified	86.72	2019	Paper ↗Code ↗	Looks wrong?
30	FAST-S-736 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	86.3	2021	Paper ↗Code ↗	Looks wrong?
31	FAST-T-736 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	86	2021	Paper ↗Code ↗	Looks wrong?
32	SLPR From paper: PixelLink: Detecting Scene Text via Instance Segmentation	verified	85.5	2018	Paper ↗Code ↗	Looks wrong?
33	PixelLink+VGG16 2s From paper: TextSnake: A Flexible Representation for Detecting Text of Arbitrary Shapes	verified	85.5	2018	Paper ↗Code ↗	Looks wrong?
34	TextSnake From paper: Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network	verified	84.9	2019	Paper ↗Code ↗	Looks wrong?
35	PAN From paper: Mask R-CNN with Pyramid Attention Network for Scene Text Detection	verified	84	2017	Paper ↗Code ↗Source ↗	Looks wrong?

F Measure

F Measure is the reported evaluation metric for ICDAR 2015. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for F Measureverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	92.23	2020	Paper ↗Code ↗	Looks wrong?
02	CharNet H-88 (multi-scale) From paper: Convolutional Character Networks	verified	91.55	2019	Paper ↗Code ↗	Looks wrong?
03	CharNet H-88 (single-scale) From paper: Convolutional Character Networks	verified	90.97	2019	Paper ↗Code ↗	Looks wrong?
04	CharNet H-50 (multi-scale) From paper: Convolutional Character Networks	verified	90.16	2019	Paper ↗Code ↗	Looks wrong?
05	SBD From paper: Exploring the Capacity of an Orderless Box Discretization Network for Multi-orientation Scene Text Detection	verified	90.1	2019	Paper ↗Code ↗	Looks wrong?
06	CharNet H-57 (multi-scale) From paper: Convolutional Character Networks	verified	90.06	2019	Paper ↗Code ↗	Looks wrong?
07	FreeReal+DBNet FreeReal with DBNet backbone, ECCV 2024. Bridging synthetic and real worlds for pre-training. Achieves 90.0% F-measure on IC15. arxiv:2312.05286.	paper	90	2024	Source ↗	Looks wrong?
08	TESTR TESTR (Text Spotting Transformers), CVPR 2022. Detection-only F-measure on ICDAR 2015 test set without lexicon. arxiv:2204.01918.	paper	90	2022	Source ↗	Looks wrong?
09	FOTS MS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	89.84	2018	Paper ↗Code ↗	Looks wrong?
10	CharNet H-50 (single-scale) From paper: Convolutional Character Networks	verified	89.7	2019	Paper ↗Code ↗	Looks wrong?
11	CharNet H-57 (single-scale) From paper: Convolutional Character Networks	verified	89.66	2019	Paper ↗Code ↗	Looks wrong?
12	PMTD* From paper: Pyramid Mask Text Detector	verified	89.33	2019	Paper ↗Code ↗	Looks wrong?
13	GNNets From paper: Geometry Normalization Networks for Accurate Scene Text Detection	verified	88.52	2019	Paper ↗Code ↗	Looks wrong?
14	FOTS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	87.99	2018	Paper ↗Code ↗	Looks wrong?
15	DBNet++ (ResNet-50) (1152) From paper: Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion	verified	87.3	2022	Paper ↗Code ↗	Looks wrong?
16	DB-ResNet-50 (1152) From paper: Real-time Scene Text Detection with Differentiable Binarization	verified	87.3	2019	Paper ↗Code ↗	Looks wrong?
17	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	87.2	2018	Paper ↗Code ↗	Looks wrong?
18	FAST-B-1280 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	87.1	2021	Paper ↗Code ↗	Looks wrong?
19	SAST From paper: A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning	verified	86.91	2019	Paper ↗Code ↗	Looks wrong?
20	CRAFT From paper: Character Region Awareness for Text Detection	verified	86.9	2019	Paper ↗Code ↗	Looks wrong?
21	EK-Net++ EK-Net++ improves EK-Net with Epoch Adaptive Weight algorithm. Expert Systems with Applications 2024.	paper	86.72	2024	Source ↗	Looks wrong?
22	FAST-B-896 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	86.3	2021	Paper ↗Code ↗	Looks wrong?
23	Mask TextSpotter From paper: Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes	verified	86	2018	Paper ↗Code ↗	Looks wrong?
24	EK-Net EK-Net (Expand Kernel Network), arXiv Jan 2024. ResNet-18 backbone at 35.42 FPS. arxiv:2401.11704.	paper	85.72	2024	Source ↗	Looks wrong?
25	PSENet-1s From paper: Shape Robust Text Detection with Progressive Scale Expansion Network	verified	85.7	2019	Paper ↗Code ↗Source ↗	Looks wrong?
26	FAST-B-736 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	84.7	2021	Paper ↗Code ↗	Looks wrong?
27	Corner-based Region Proposals From paper: Detecting Multi-Oriented Text with Corner-based Region Proposals	verified	84.5	2018	Paper ↗Code ↗	Looks wrong?
28	SLPR From paper: PixelLink: Detecting Scene Text via Instance Segmentation	verified	84.5	2018	Paper ↗Code ↗	Looks wrong?
29	Corner Localization (multi-scale) From paper: Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation	verified	84.3	2018	Paper ↗Code ↗	Looks wrong?
30	FTSN + MNMS From paper: Fused Text Segmentation Networks for Multi-oriented Scene Text Detection	verified	84.1	2017	Paper ↗	Looks wrong?
31	PixelLink+VGG16 2s From paper: TextSnake: A Flexible Representation for Detecting Text of Arbitrary Shapes	verified	83.7	2018	Paper ↗Code ↗	Looks wrong?

recall

Recall is the reported evaluation metric for ICDAR 2015. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for recallverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	CharNet H-88 (single-scale) From paper: Convolutional Character Networks	verified	91.98	2019	Paper ↗Code ↗	Looks wrong?
02	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	90.56	2020	Paper ↗Code ↗	Looks wrong?
03	CharNet H-88 (multi-scale) From paper: Convolutional Character Networks	verified	90.47	2019	Paper ↗Code ↗	Looks wrong?
04	CharNet H-57 (single-scale) From paper: Convolutional Character Networks	verified	90.45	2019	Paper ↗Code ↗	Looks wrong?
05	TESTR TESTR (Text Spotting Transformers), CVPR 2022. Detection-only F-measure on ICDAR 2015 test set without lexicon. arxiv:2204.01918.	unverified	89.7	2022	Source ↗	Looks wrong?
06	CharNet H-50 (multi-scale) From paper: Convolutional Character Networks	verified	89.44	2019	Paper ↗Code ↗	Looks wrong?
07	CharNet H-57 (multi-scale) From paper: Convolutional Character Networks	verified	88.74	2019	Paper ↗Code ↗	Looks wrong?
08	CharNet H-50 (single-scale) From paper: Convolutional Character Networks	verified	88.3	2019	Paper ↗Code ↗	Looks wrong?
09	SBD From paper: Exploring the Capacity of an Orderless Box Discretization Network for Multi-orientation Scene Text Detection	verified	88.2	2019	Paper ↗Code ↗	Looks wrong?
10	FOTS MS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	87.92	2018	Paper ↗Code ↗	Looks wrong?
11	PMTD* From paper: Pyramid Mask Text Detector	verified	87.43	2019	Paper ↗Code ↗	Looks wrong?
12	SAST From paper: A Single-Shot Arbitrarily-Shaped Text Detector based on Context Attended Multi-Task Learning	verified	87.09	2019	Paper ↗Code ↗	Looks wrong?
13	GNNets From paper: Geometry Normalization Networks for Accurate Scene Text Detection	verified	86.71	2019	Paper ↗Code ↗	Looks wrong?
14	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	85.8	2018	Paper ↗Code ↗	Looks wrong?
15	FOTS From paper: FOTS: Fast Oriented Text Spotting with a Unified Network	verified	85.17	2018	Paper ↗Code ↗	Looks wrong?
16	FAST-B-1280 From paper: FAST: Faster Arbitrarily-Shaped Text Detector with Minimalist Kernel Representation	verified	84.6	2021	Paper ↗Code ↗	Looks wrong?
17	PSENet-1s From paper: Shape Robust Text Detection with Progressive Scale Expansion Network	verified	84.5	2019	Paper ↗Code ↗Source ↗	Looks wrong?
18	CRAFT From paper: Character Region Awareness for Text Detection	verified	84.3	2019	Paper ↗Code ↗	Looks wrong?
19	DBNet++ (ResNet-50) (1152) From paper: Real-Time Scene Text Detection with Differentiable Binarization and Adaptive Scale Fusion	verified	83.9	2022	Paper ↗Code ↗	Looks wrong?

F Measure Strong Lexicon

F Measure Strong Lexicon is the reported evaluation metric for ICDAR 2015. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for F Measure Strong Lexiconverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	UNITS From paper: Towards Unified Scene Text Spotting based on Sequence Generation	verified	89	2023	Paper ↗Code ↗	Looks wrong?
02	DeepSolo (ViTAEv2-S, TextOCR) From paper: DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting	verified	88.1	2022	Paper ↗Code ↗	Looks wrong?
03	DeepSolo (ResNet-50, TextOCR) From paper: DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting	verified	88	2022	Paper ↗Code ↗	Looks wrong?
04	DeepSolo (ResNet-50) From paper: DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting	verified	86.8	2022	Paper ↗Code ↗	Looks wrong?
05	SRTS From paper: Single Shot Self-Reliant Scene Text Spotter by Decoupled yet Collaborative Detection and Recognition	verified	85.6	2022	Paper ↗Code ↗	Looks wrong?
06	TESTR From paper: Text Spotting Transformers	verified	85.2	2022	Paper ↗Code ↗	Looks wrong?
07	A3S From paper: A3S: Adversarial learning of semantic representations for Scene-Text Spotting	verified	84.8	2023	Paper ↗	Looks wrong?
08	GLASS From paper: GLASS: Global to Local Attention for Scene-Text Spotting	verified	84.7	2022	Paper ↗Code ↗	Looks wrong?
09	SwinTextSpotter From paper: SwinTextSpotter: Scene Text Spotting via Better Synergy between Text Detection and Text Recognition	verified	83.9	2022	Paper ↗Code ↗	Looks wrong?

F Measure Weak Lexicon

F Measure Weak Lexicon is the reported evaluation metric for ICDAR 2015. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for F Measure Weak Lexiconverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	UNITS From paper: Towards Unified Scene Text Spotting based on Sequence Generation	verified	84.1	2023	Paper ↗Code ↗	Looks wrong?
02	DeepSolo (ViTAEv2-S, TextOCR) From paper: DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting	verified	83.9	2022	Paper ↗Code ↗	Looks wrong?

§ 04 · Submit a result

Add to the leaderboard.

← Back to Scene Text Detection