Donate Speech: Annotated dataset 
View resource name in all available languages
Lahjoita puhetta: Annotoitu aineisto
puhelahjat-annotated
Persistent Identifier of this resource:
http://urn.fi/urn:nbn:fi:lb-2022060128
Access location:
This collection contains the manually transcribed recordings of the Donate Speech Corpus, version 1 that were available at the time of publishing the complete dataset.
The transcripts are included as plain text files and as annotation files with time alignments. The dataset also contains the metadata of the audio recordings.
The total duration of the audio recordings included in this transcribed and annotated dataset is approximately 1600 hours.
The dataset is available for download via Kielipankki – the Language Bank of Finland.
View resource description in all available languagesTämä Lahjoita puhetta -aineiston osakokoelma sisältää kaikki ne Lahjoita puhetta -aineiston versioon 1.0 kuuluvat äänitteet, jotka oli koko aineiston julkaisuun mennessä ehditty litteroida käsin. Litteraatit ovat saatavilla sekä raakatekstitiedostoina että äänitteisiin kohdistettuina annotaatiotiedostoina. Aineistoon sisältyvät myös kyseisten äänitteiden kuvailutiedot.
Tähän osa-aineistoon kuuluvien litteroitujen ja kohdistettujen äänitteiden kokonaiskesto on noin 1600 tuntia.
Aineisto on saatavilla Kielipankin latauspalvelussa.
The transcripts are included as plain text files and as annotation files with time alignments. The dataset also contains the metadata of the audio recordings.
The total duration of the audio recordings included in this transcribed and annotated dataset is approximately 1600 hours.
The dataset is available for download via Kielipankki – the Language Bank of Finland.
Tämä Lahjoita puhetta -aineiston osakokoelma sisältää kaikki ne Lahjoita puhetta -aineiston versioon 1.0 kuuluvat äänitteet, jotka oli koko aineiston julkaisuun mennessä ehditty litteroida käsin. Litteraatit ovat saatavilla sekä raakatekstitiedostoina että äänitteisiin kohdistettuina annotaatiotiedostoina. Aineistoon sisältyvät myös kyseisten äänitteiden kuvailutiedot.
Tähän osa-aineistoon kuuluvien litteroitujen ja kohdistettujen äänitteiden kokonaiskesto on noin 1600 tuntia.
Aineisto on saatavilla Kielipankin latauspalvelussa.
People who looked at this resource also viewed the following: