Dataset

Berisi audio clean dan noise.

Pengambilan audio clean dan noise.

Clean

Dataset clean berasal dari Mozilla Common Voice

Versi	Tanggal	Ukuran	Jam Terekam	Jam Tervalidasi	Lisensi	Jumlah Suara	Format Audio
Common Voice Delta Segment 21.0	19/3/2025	781,24 MB	39	21	CC-0	993	MP3

Versi	Tanggal	Ukuran	Jam Terekam	Jam Tervalidasi	Lisensi	Jumlah Suara	Format Audio
Common Voice Delta Segment 21.0	19/3/2025	6,39 MB	1	1	CC-0	22	MP3

Noise

Dataset noise berasal dari DEMAND

File	Ukuran	Download
SPSQUARE_16k.zip	110.9 MB	Download
STRAFFIC_16k.zip	118.6 MB	Download

Standarisasi audio clean dan noise.

Kebutuhan

Audio clean dan noise harus memenuhi standar.

Dataset	Format	Channel	Sample Rate	Total
Clean	WAV	Mono	16 kHz	20 Audio
Noise	WAV	Mono	16 kHz	17 Audio

Gabungan antara audio clean dengan berbagai noise yang tersedia.

Hasil

Total seluruh audio yang digunakan ada di Dataset-DTLN.

Bahasa	Clean	Noise	Durasi	SNR	Total
Inggris	10 Audio	17 Kategori	~5 detik	0 db, 5 db, -5 db, 10 db	680 Audio (~56.6 menit)
Indonesia	10 Audio	17 Kategori	~5 detik	0 db, 5 db, -5 db, 10 db	680 Audio (~56.6 menit)