Who leads the MusicCaps benchmark?

MusicGen-Medium currently leads MusicCaps with a score of 4.89 on Fad.

What is the state-of-the-art score on MusicCaps?

The state-of-the-art result on MusicCaps is 4.89 (Fad), achieved by MusicGen-Medium as of 2026.

How many models are tracked on MusicCaps?

Codesota tracks 7 models on MusicCaps.

When was the MusicCaps leaderboard last updated?

The MusicCaps leaderboard on Codesota includes results through 2026, with the earliest tracked result from 2023.

Codesota · Benchmark · MusicCapsHome/Leaderboards/Audio & Speech/Music Generation/MusicCaps

Unknown

MusicCaps.

Name: MusicCaps Benchmark Results
Creator: Unknown
Published: 2023-01-01
License: https://creativecommons.org/licenses/by/4.0/

Music generation evaluated on 5.5K expert-annotated music clips

Paper ↗Leaderboard ↓

§ 01 · SOTA history

Year over year.

§ 02 · Leaderboard

Results by metric.

Found a wrong score or missing run?

Use row edits to send a sourced correction into moderation.

Add / edit result ↗Report issue ↗

Fad

Fad is the reported evaluation metric for MusicCaps. Codesota tracks published model scores on this metric so readers can compare state-of-the-art results across sources and model families.

Higher is better

Trust tiers for Fadverifiedpapervendorcommunityunverified

Muted rows were not state of the art when published — an earlier or same-year result already scored better.

Rank	Model	Trust	Score	Year	Links	Fix
01	MusicGen-Medium MusicGen-Medium (Copet et al., Meta AI, NeurIPS 2023). FAD on MusicCaps. Reproduced result in AudioLDM 2 Table III.	verified	4.89	2023	Source ↗	Looks wrong?
02	AudioLDM 2-MSD AudioLDM 2-MSD (MagnaTagATune/Million Song Dataset variant). FAD on MusicCaps. Table III in paper.	verified	4.47	2024	Source ↗	Looks wrong?
03	MusicLM MusicLM (Agostinelli et al., Google, 2023). FAD on MusicCaps. Reported in AudioLDM 2 Table III (not reproduced).	verified	4.00	2023	Source ↗	Looks wrong?
04	MusicGen Large MusicGen 3.3B, MusicCaps. Table 3, FAD_vgg.	paper	3.80	2026	Source ↗	Looks wrong?
05	AudioLDM-M AudioLDM medium (Liu et al., ICML 2023). FAD on MusicCaps. Reproduced in AudioLDM 2 Table III.	verified	3.20	2023	Source ↗	Looks wrong?
06	AudioLDM 2-Full AudioLDM 2-Full (Liu et al., IEEE/ACM TASLP 2024). Best FAD on MusicCaps evaluation set. Table III in paper.	verified	3.13	2024	Source ↗	Looks wrong?
07	Noise2Music Noise2Music waveform model, MusicCaps FAD_vgg. Table 3.	paper	2.13	2026	Source ↗	Looks wrong?

§ 04 · Submit a result

Add to the leaderboard.

← Back to Music Generation