Donate Speech: Selected dataset

View resource name in all available languages

Lahjoita puhetta: Valikoitu aineisto

puhelahjat-selected

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2022060127

Access location:

This collection of subsets of the Donate Speech Corpus was originally built for the development of an automatic speech recognition system. The resource is available for download in Kielipankki – The Language Bank of Finland.

The Selected dataset includes the following subsets of the Donate Speech Corpus, version 1:
- Donate Speech Corpus: Training data (100h), http://urn.fi/urn:nbn:fi:lb-2022060123
- Donate Speech Corpus: Test data (10h), http://urn.fi/urn:nbn:fi:lb-2022060122
- Donate Speech Corpus: Development data (10h), http://urn.fi/urn:nbn:fi:lb-2022060121
- Donate Speech Corpus: Multi-transcriber test data (1h), http://urn.fi/urn:nbn:fi:lb-2022060124
- Donate Speech Corpus: Test data from multi-transcriber speakers (10h), http://urn.fi/urn:nbn:fi:lb-2022060125

The total duration of the recordings in the aforementioned datasets is approximately 131 hours.

View resource description in all available languages

Tämä Lahjoita puhetta -aineiston osakokoelma on rakennettu automaattisen puheentunnistimen kehitystyötä varten. Aineisto on saatavilla Kielipankin latauspalvelussa.

Valikoituun aineistoon sisältyvät seuraavat Lahjoita puhetta -aineiston versioon 1 kuuluvat osa-aineistot:
- Lahjoita puhetta -aineisto: Opetusdata (100h), http://urn.fi/urn:nbn:fi:lb-2022060123
- Lahjoita puhetta -aineisto: Testidata (10h), http://urn.fi/urn:nbn:fi:lb-2022060122
- Lahjoita puhetta -aineisto: Kehitysdata (10h), http://urn.fi/urn:nbn:fi:lb-2022060121
- Lahjoita puhetta -aineisto: Usean litteroijan testidata (1h), http://urn.fi/urn:nbn:fi:lb-2022060124
- Lahjoita puhetta -aineisto: Testidata useaan kertaan litteroiduilta puhujilta (10h), http://urn.fi/urn:nbn:fi:lb-2022060125

Edellä mainittujen osa-aineistojen äänitteiden yhteenlaskettu kesto on noin 131 tuntia.

You don’t have the permission to edit this resource.