Optical Character Recognition2020en

mldoc-zero-shot-english-to-french

Dataset from Papers With Code

Metrics:accuracy, cer, wer, f1

Current State of the Art

XLMft UDA

Unknown

96.05

accuracy

Showing 3 breakthroughs from May 2018 to Sep 2019

May 2018

BiLSTM (UN)

From paper: A Corpus for Multilingual Document Classification in Eight Languages

74.5

Dec 2018

Massively Multilingual Sentence Embeddings

From paper: Massively Multilingual Sentence Embeddings for Zero-Shot Cross-Lingual Transfer and Beyond

78.0

+4.6%

Sep 2019

XLMft UDACurrent SOTA

From paper: Bridging the domain gap in cross-lingual document classification

96.0

+23.2%

Total Improvement

28.9%

Time Span

1y 4m

Breakthroughs

Current SOTA

96.0

Top 6 models ranked by accuracy

Best Score

96.0

Top Model

XLMft UDA

Models Compared

Score Range

23.7

accuracyPrimary

#	Model	Score	Paper / Code	Date
1	XLMft UDA	96.05	Bridging the domain gap in cross-lingual document classification Code	Sep 2019
2	MultiFiT, pseudo	89.42	MultiFiT: Efficient Multi-lingual Language Model Fine-tuning Code	Sep 2019
3	Massively Multilingual Sentence Embeddings	77.95	Massively Multilingual Sentence Embeddings for Zero-Shot Cross-Lingual Transfer and Beyond Code	Dec 2018
4	BiLSTM (UN)	74.52	A Corpus for Multilingual Document Classification in Eight Languages Code	May 2018
5	BiLSTM (Europarl)	72.83	A Corpus for Multilingual Document Classification in Eight Languages Code	May 2018
6	MultiCCA + CNN	72.38	A Corpus for Multilingual Document Classification in Eight Languages Code	May 2018