Finnish Conversation Analysis Archive

View resource name in all available languages

Keskusteluntutkimuksen arkisto

FCAA

Finnish Conversation Analysis Archive is a collection of recordings of Finnish speech in interaction, collected by a number of researchers and students for various individual studies and research projects. The collection contains 500 hours of audio and video recordings of which approximately 100 hours have also been transcribed. The data mainly contains recordings of everyday conversations, telephone calls among family members, and e.g. children playing. In addition the data contains some recordings of conversations at more institutional settings, such as various types of service encounters, class room situations and political debates in the media.

The audio recordings are stored as mp3 or wav files, the video data are, e.g., in mpg or wmv files, and the conversation transcriptions are in rtf format.
There is a detailed list of the archived data.

Currently, the data from the archive is only available locally from the University of Helsinki. With the Language Bank of Finland, there are plans to publish those parts of the archive that are not yet available elsewhere. Due to personal data issues, most parts of the archive are likely to become available under a restricted license for research use only. The process of making the data available will take time, and the subcorpora can be published individually once their licenses have been cleared.

View resource description in all available languages

Keskusteluntutkimuksen arkisto on yksi Suomen laajimmista suomenkielisen vuorovaikutuspuheen kokoelmista. Tällä hetkellä ääni- tai ääni- ja kuvanauhoitettua aineistoa on arkistossa yli 500 tuntia, josta litteroituna on noin 100 tuntia. Pääasiallisesti korpus koostuu arkipuheesta (mm. pariskuntien puheluita, perheen kahvipöytäkeskusteluja ja lasten leikkejä) mutta mukana on myös jonkin verran institutionaalista puhetta (asiointipuheluita, kampaamokeskusteluja, poliittisia tv-väittelyjä ja luokkahuonekeskustelua).

Arkiston aineistoon kuuluvat tallenteet ja litteraatit. Kaikki aineisto on sähköisessä muodossa, mutta ei vielä verkosta ladattavissa. Äänitiedostojen yleisimmät muodot ovat mp3 ja wav. Videoaineistoa löytyy muun muassa mpg- ja wmv-muodoissa. Aineistosta on yksityiskohtainen sähköinen kortisto.

Tällä hetkellä aineisto on saatavissa ainoastaan paikallisesti Helsingin yliopistosta. Kielipankissa on tarkoitus julkaista arkistosta ne osat, jotka eivät vielä ole muualla saatavilla. Aineistoihin sisältyvien henkilötietojen vuoksi useimmat osa-aineistot tullaan julkaisemaan rajoitetulla lisenssillä ainoastaan tutkimustarkoituksiin. Aineistojen saataville tuominen vie aikaa, joten osa-aineistoja voidaan julkaista yksitellen sitä mukaa, kun niiden käyttöehdot on selvitetty.

You don’t have the permission to edit this resource.