Dataset
Berisi audio clean dan noise.
1
Sumber
Pengambilan audio clean dan noise.
Clean
Dataset clean berasal dari Mozilla Common Voice
Bahasa Inggris
| Versi | Tanggal | Ukuran | Jam Terekam | Jam Tervalidasi | Lisensi | Jumlah Suara | Format Audio |
|---|---|---|---|---|---|---|---|
| Common Voice Delta Segment 21.0 | 19/3/2025 | 781,24 MB | 39 | 21 | CC-0 | 993 | MP3 |
Bahasa Indonesia
| Versi | Tanggal | Ukuran | Jam Terekam | Jam Tervalidasi | Lisensi | Jumlah Suara | Format Audio |
|---|---|---|---|---|---|---|---|
| Common Voice Delta Segment 21.0 | 19/3/2025 | 6,39 MB | 1 | 1 | CC-0 | 22 | MP3 |
Noise
Dataset noise berasal dari DEMAND
Domestic
Nature
Office
Public
2
Format
Standarisasi audio clean dan noise.
Kebutuhan
Audio clean dan noise harus memenuhi standar.
| Dataset | Format | Channel | Sample Rate | Total |
|---|---|---|---|---|
| Clean | WAV | Mono | 16 kHz | 20 Audio |
| Noise | WAV | Mono | 16 kHz | 17 Audio |
3
Generate
Gabungan antara audio clean dengan berbagai noise yang tersedia.
Hasil
Total seluruh audio yang digunakan ada di Dataset-DTLN.
| Bahasa | Clean | Noise | Durasi | SNR | Total |
|---|---|---|---|---|---|
| Inggris | 10 Audio | 17 Kategori | ~5 detik | 0 db, 5 db, -5 db, 10 db | 680 Audio (~56.6 menit) |
| Indonesia | 10 Audio | 17 Kategori | ~5 detik | 0 db, 5 db, -5 db, 10 db | 680 Audio (~56.6 menit) |