Codesota · Benchmark · icdar-2013Home/Leaderboards/Vision & Documents/Scene Text Detection/icdar-2013

Unknown

icdar-2013.

icdar-2013 is a state-of-the-art machine learning benchmark indexed on Codesota. This page tracks published model results, top scores per metric, and the SOTA timeline for icdar-2013.

Paper ↗Leaderboard ↓

§ 01 · SOTA history

Year over year.

§ 02 · Leaderboard

Results by metric.

Found a wrong score or missing run?

Use row edits to send a sourced correction into moderation.

Add / edit result ↗Report issue ↗

Accuracy

Accuracy is the reported evaluation metric for icdar-2013. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for Accuracyverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	JSTR IC13, synthetic training data (MJ+ST). Best synth result. IntelliSys 2024. JSTR Table 1.	verified	99.2	2024	Paper ↗	Looks wrong?
02	CLIP4STR-L (RBU 6.5M) IC13_1015 split. Trained on RBU 6.5M real data. IEEE TIP Dec 2024. CLIP4STR Table III.	verified	99	2023	Paper ↗	Looks wrong?
03	CLIP4STR-H (DFN-5B) IC13_1015 split. ViT-H/14 pre-trained on DFN-5B. IEEE TIP Dec 2024. CLIP4STR Table III.	verified	98.9	2023	Paper ↗	Looks wrong?
04	DTrOCR IC13, synthetic training data (MJ+ST). WACV 2024. Verified via JSTR Table 1 (arxiv:2404.05967).	verified	98.8	2023	Paper ↗	Looks wrong?
05	SVTRv2-B IC13_1015 split. SVTRv2-B (Base). CTC-based. ICCV 2025. Table 3. Best CTC result.	verified	98.7	2024	Paper ↗	Looks wrong?
06	LISTER IC13_1015 split, lowercase alphanum eval. ICCV 2023. Verified in SVTRv2 Table 3.	verified	98.6	2023	Paper ↗	Looks wrong?
07	SVTRv2-S IC13_1015 split. SVTRv2-S (Small). CTC-based. ICCV 2025. Table 3.	verified	98.5	2024	Paper ↗	Looks wrong?
08	TrOCR-large 558M TrOCR-large, Syn+Benchmark training. Table 6. AAAI 2023.	verified	98.4	2021	Paper ↗	Looks wrong?
09	TrOCR-base 334M TrOCR-base, Syn+Benchmark training. Table 6. AAAI 2023.	verified	98.4	2021	Paper ↗	Looks wrong?
10	CPPD IC13_1015 split, lowercase alphanum eval. Verified in SVTRv2 Table 3.	verified	98.2	2023	Paper ↗	Looks wrong?
11	MAERec IC13_1015 split, lowercase alphanum eval. MAERec ViT-B. Verified in SVTRv2 Table 3.	verified	98.2	2023	Paper ↗	Looks wrong?
12	PARSeq IC13_1015 split, lowercase alphanum eval. ECCV 2022.	verified	98.13	2022	Paper ↗	Looks wrong?
13	SVTRv2-T IC13_1015 split. SVTRv2-T (Tiny). CTC-based. ICCV 2025. Table 3.	verified	98	2024	Paper ↗	Looks wrong?
14	ABINet-LV ABINet Language-Vision variant. CVPR 2021.	verified	97	2021	Paper ↗	Looks wrong?
15	CRNN Lexicon-free. Table 2. TPAMI 2017.	verified	86.7	2015	Paper ↗	Looks wrong?

Precision

Precision is the reported evaluation metric for icdar-2013. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for Precisionverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	CRAFT From paper: Character Region Awareness for Text Detection	verified	97.4	2019	Paper ↗Code ↗	Looks wrong?
02	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	97.27	2020	Paper ↗Code ↗	Looks wrong?
03	Mask TextSpotter From paper: Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes	verified	95	2018	Paper ↗Code ↗	Looks wrong?
04	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	93.8	2018	Paper ↗Code ↗	Looks wrong?
05	WordSup (VGG16-synth-icdar) From paper: WordSup: Exploiting Word Annotations for Character based Text Detection	verified	93.34	2017	Paper ↗	Looks wrong?
06	Gupta et al. From paper: Synthetic Data for Text Localisation in Natural Images	verified	92	2016	Paper ↗Code ↗	Looks wrong?
07	Corner Localization (multi-scale) From paper: Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation	verified	92	2018	Paper ↗Code ↗	Looks wrong?
08	Corner-based Region Proposals From paper: Detecting Multi-Oriented Text with Corner-based Region Proposals	verified	91.9	2018	Paper ↗Code ↗	Looks wrong?
09	TextBoxes++_MS From paper: TextBoxes++: A Single-Shot Oriented Scene Text Detector	verified	91	2018	Paper ↗Code ↗	Looks wrong?
10	PixelLink+VGG16 2s MS From paper: PixelLink: Detecting Scene Text via Instance Segmentation	verified	88.6	2018	Paper ↗Code ↗	Looks wrong?
11	Jaderberg et al. From paper: Reading Text in the Wild with Convolutional Neural Networks	verified	88.5	2014	Paper ↗	Looks wrong?
12	SSTD From paper: Single Shot Text Detector with Regional Attention	verified	88	2017	Paper ↗Code ↗	Looks wrong?
13	SegLink From paper: Detecting Oriented Text in Natural Images by Linking Segments	verified	87.7	2017	Paper ↗Code ↗	Looks wrong?
14	Neumann et al. * From paper: Efficient Scene Text Localization and Recognition with Local Character Refinement	verified	81.8	2015	Paper ↗	Looks wrong?

H Mean

H Mean is the reported evaluation metric for icdar-2013. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for H Meanverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	CRAFT From paper: Character Region Awareness for Text Detection	verified	95.2	2019	Paper ↗Code ↗	Looks wrong?

F Measure

F Measure is the reported evaluation metric for icdar-2013. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for F Measureverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	94.61	2020	Paper ↗Code ↗	Looks wrong?
02	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	92.1	2018	Paper ↗Code ↗	Looks wrong?
03	Mask TextSpotter From paper: Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes	verified	91.7	2018	Paper ↗Code ↗	Looks wrong?
04	WordSup (VGG16-synth-icdar) From paper: WordSup: Exploiting Word Annotations for Character based Text Detection	verified	90.34	2017	Paper ↗	Looks wrong?
05	STN-OCR From paper: STN-OCR: A single Neural Network for Text Detection and Text Recognition	verified	90.3	2017	Paper ↗Code ↗	Looks wrong?
06	PixelLink+VGG16 2s MS From paper: PixelLink: Detecting Scene Text via Instance Segmentation	verified	88.1	2018	Paper ↗Code ↗	Looks wrong?
07	Corner Localization (multi-scale) From paper: Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation	verified	88	2018	Paper ↗Code ↗	Looks wrong?
08	TextBoxes++_MS From paper: TextBoxes++: A Single-Shot Oriented Scene Text Detector	verified	88	2018	Paper ↗Code ↗	Looks wrong?
09	Corner-based Region Proposals From paper: Detecting Multi-Oriented Text with Corner-based Region Proposals	verified	87.6	2018	Paper ↗Code ↗	Looks wrong?
10	SSTD From paper: Single Shot Text Detector with Regional Attention	verified	87	2017	Paper ↗Code ↗	Looks wrong?
11	SegLink From paper: Detecting Oriented Text in Natural Images by Linking Segments	verified	85.3	2017	Paper ↗Code ↗	Looks wrong?
12	Gupta et al. From paper: Synthetic Data for Text Localisation in Natural Images	verified	83	2016	Paper ↗Code ↗	Looks wrong?
13	USM (COCO TS + ICDAR–2013) From paper: Unsharp Masking Layer: Injecting Prior Knowledge in Convolutional Networks for Image Classification	verified	80.4	2019	Paper ↗Code ↗	Looks wrong?
14	Neumann et al. * From paper: Efficient Scene Text Localization and Recognition with Local Character Refinement	verified	77.1	2015	Paper ↗	Looks wrong?
15	Jaderberg et al. From paper: Reading Text in the Wild with Convolutional Neural Networks	verified	76.8	2014	Paper ↗	Looks wrong?

Recall

Recall is the reported evaluation metric for icdar-2013. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for Recallverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	CRAFT From paper: Character Region Awareness for Text Detection	verified	93.1	2019	Paper ↗Code ↗	Looks wrong?
02	TextFuseNet (ResNeXt-101) From paper: TextFuseNet: Scene Text Detection with Richer Fused Features	verified	92.09	2020	Paper ↗Code ↗	Looks wrong?
03	SPCNET From paper: Scene Text Detection with Supervised Pyramid Context Network	verified	90.5	2018	Paper ↗Code ↗	Looks wrong?
04	Mask TextSpotter From paper: Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes	verified	88.6	2018	Paper ↗Code ↗	Looks wrong?
05	WordSup (VGG16-synth-icdar) From paper: WordSup: Exploiting Word Annotations for Character based Text Detection	verified	87.53	2017	Paper ↗	Looks wrong?
06	PixelLink+VGG16 2s MS From paper: PixelLink: Detecting Scene Text via Instance Segmentation	verified	87.5	2018	Paper ↗Code ↗	Looks wrong?
07	SSTD From paper: Single Shot Text Detector with Regional Attention	verified	86	2017	Paper ↗Code ↗	Looks wrong?
08	Corner Localization (multi-scale) From paper: Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation	verified	84.4	2018	Paper ↗Code ↗	Looks wrong?
09	TextBoxes++_MS From paper: TextBoxes++: A Single-Shot Oriented Scene Text Detector	verified	84	2018	Paper ↗Code ↗	Looks wrong?
10	Corner-based Region Proposals From paper: Detecting Multi-Oriented Text with Corner-based Region Proposals	verified	83.9	2018	Paper ↗Code ↗	Looks wrong?
11	SegLink From paper: Detecting Oriented Text in Natural Images by Linking Segments	verified	83	2017	Paper ↗Code ↗	Looks wrong?
12	Gupta et al. From paper: Synthetic Data for Text Localisation in Natural Images	verified	75.5	2016	Paper ↗Code ↗	Looks wrong?
13	Neumann et al. * From paper: Efficient Scene Text Localization and Recognition with Local Character Refinement	verified	72.4	2015	Paper ↗	Looks wrong?
14	Jaderberg et al. From paper: Reading Text in the Wild with Convolutional Neural Networks	verified	67.8	2014	Paper ↗	Looks wrong?

§ 04 · Submit a result

Add to the leaderboard.

← Back to Scene Text Detection