Corpus of Age-related Voice Disguise (AVOID)

View resource name in all available languages

Muunnellun puheen korpus

AVOID

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2018060621

This corpus includes normal and age-related disguised speech uttered by 60 native Finnish speakers (31 females and 29 males). The speakers were asked to read the same text fragments several times, in their modal voice and in two disguised voices, first pretending to be an elderly speaker and then pretending to be a child. The texts consisted of the Finnish translations of The Rainbow Passage and The North Wind and the Sun, and two selected English sentences from the TIMIT[1] corpus (SA1, SA2). The corpus includes samples of 78 different sentences per speaker (66 Finnish, 12 English). The speech was recorded simultaneously with a portable recorder with close-talking microphone, and two smartphones applications, yielding a total of 14040 audio files (3 * 4680). The material was recorded in summer 2015 in order to study the effect of voice disguise on automatic speaker recognition.

The corpus will be made available in Kielipankki, The Language Bank of Finland.


Further information is available in the following publications:

Rosa González Hautamäki, Md Sahidullah, Tomi Kinnunen and Ville Hautamäki, "Age-Related Voice Disguise and its Impact in Speaker Verification Accuracy", Proc. Odyssey: the Speaker and Language Recognition Workshop, Bilbao, Spain, June, 2016.

Rosa González Hautamäki, Md Sahidullah, Ville Hautamäki and Tomi Kinnunen, "Acoustical and perceptual study of voice disguise by age modification in speaker verification", Speech Communication, Volume 95, December 2017, Pages 1-15, doi: doi.org/10.1016/j.specom.2017.10.002

View resource description in all available languages

Korpus koostuu puhenäytteistä, joissa puhujat lukevat tekstiä ääneen joko normaalilla äänellään tai siten, että he pyrkivät kuulostamaan eri-ikäiseltä henkilöltä. Aineisto sisältää näytteet 60 aikuiselta puhujalta (31 naista, 29 miestä), joista jokainen osallistui kahteen äänitykseen. Kummassakin äänityksessä puhuja luki ääneen kaksi suomenkielistä tekstikatkelmaa ja kaksi englanninkielistä virkettä kerran omalla äänellään, kerran teeskentelemällä vanhusta ja kerran teeskentelemällä lasta. Suomenkielisinä teksteinä olivat "Sateenkaaritarina" ja "Pohjantuuli ja aurinko". Englanninkieliset lauseet oli poimittu TIMIT[1]-korpuksesta (SA1, SA2). Aineisto sisältää jokaisen puhujan näytteet 78 eri virkkeestä (66 suomeksi ja 12 englanniksi). Virkkeet on tallennettu yksitellen WAV-muotoisiin äänitiedostoihin. Puhenäytteet äänitettiin samanaikaisesti sekä kannettavalla tallentimella että kahdella älypuhelimella, joten äänitiedostoja on kaikkiaan 14040 kpl (3 * 4680). Aineisto on kerätty kesällä 2015 hankkeessa, jossa tutkittiin teeskentelyn vaikutusta automaattiseen puheentunnistukseen.

Korpus on tulossa saataville Kielipankin kautta.


Lisätietoa aineistosta seuraavissa julkaisuissa:

Rosa González Hautamäki, Md Sahidullah, Tomi Kinnunen and Ville Hautamäki, "Age-Related Voice Disguise and its Impact in Speaker Verification Accuracy", Proc. Odyssey: the Speaker and Language Recognition Workshop, Bilbao, Spain, June, 2016.

Rosa González Hautamäki, Md Sahidullah, Ville Hautamäki and Tomi Kinnunen, "Acoustical and perceptual study of voice disguise by age modification in speaker verification", Speech Communication, Volume 95, December 2017, Pages 1-15, doi: doi.org/10.1016/j.specom.2017.10.002

You don’t have the permission to edit this resource.