The Corpus of Border Karelia

View resource name in all available languages

Raja-Karjalan korpus

FINKAFINKA

ID:

http://urn.fi/urn:nbn:fi:lb-2014073033

islrn.org/resources/288-221-011-723-8

The Corpus of Border Karelia contains the audio recordings and transcripts of dialects spoken in the area of Border Karelia, where the very closely related varieties of eastern Finnish dialects and Karelian were in contact. The informants are evacuees who were mainly moved to eastern Finland after World War II.

The original interviews were recorded in the 1960s and the 1970s and transcribed at the University of Eastern Finland by various researchers using the Finno-Ugrian transcription system. The interviewees are elderly people who were born in the 1870s - 1910s.

The original material has been archived by the Institute for the Languages of Finland. During the FINKA project (funded by the Academy of Finland in 2011–2014), the transcripts were reviewed and reorganized into a machine-readable corpus that is compatible with modern research tools.

The written transcripts of the corpus will be made accessible through the Korp concordance tool (https://korp.csc.fi). The transcripts are also aligned with the corresponding audio files, and this subset will be made available through the LAT system (http://lat.csc.fi).

View resource description in all available languages

Raja-Karjalan korpus sisältää yht. 119 t 4 min 58 s audiotiedostoja (.wav) sekä niiden suomalais-ugrilaisella tarkekirjoituksella tuotetut transkriptiot, jotka ovat UTF-8-merkistökoodattuja raakatekstitiedostoja (.txt) ja jotka on kohdistettu lausumatasolle äänteitä vastaamattomista merkeistä riisuttuina TextGrid-tiedostoina. Yhteensä aineiston koko on noin 40 GB.

Äänitteet edustavat 1800-luvun lopulla ja 1900-luvun alussa syntyneiden rajakarjalaisten haastattelupuhetta, jota on tallennettu Kotimaisten kielten keskuksen Suomen kielen nauhoitearkiston kokoelmiin pääosin 1960- ja 1970-luvuilla. Näytteet edustavat Ilomantsin, Korpiselän, Suojärven, Suistamon, Impilahden ja Salmin pitäjien murretta.

Korpus on luotu seuraavilla rahoituksilla: Karjalaisen Kulttuurin Edistämissäätiö (hanke Raja-Karjalan karjala, 2009–2011, näytteiden litteroiminen), Suomen Akatemia (hanke Suomen ja karjalan rajalla: näkökulmia lähisukukieliin ja niiden murteisiin [FINKA], 2011–2014, näytteiden litteroiminen ja tarkistaminen), Koneen Säätiö (hanke Suomen itäpuolisten lähialueiden kielikorpukset [SILK], 2013–2015, näytteiden litteroiminen, tarkistaminen ja editointi) ja Karjalaisen Kulttuurin Edistämissäätiö (hanke Raja-Karjalan ja inkerinsuomen murrekorpukset [SILK 2], 2016–2017, litterointien kohdistaminen äänitteisiin).

Korpustyöhön ovat osallistuneet seuraavat opiskelijat ja tutkijat:

Litteroijat:
Niina Makkonen, Henna Massinen, Ilona Paajanen, Laura Piironen (nyk. Arantola) ja Ilja Moshnikov

Litterointien tarkistajat:
Pekka Zaikov, Ilja Moshnikov ja Marjatta Palander

Korpustyöntekijät (editointi, kohdistus):
Ilja Moshnikov ja Lauri Tavi.

You don’t have the permission to edit this resource.