Samples of Spoken Finnish

View resource name in all available languages

Suomen kielen näytteitä

SKN

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-201407141

Available in Kielipankki - the Language Bank of Finland (LAT, http://urn.fi/urn:nbn:fi:lb-1001100134, and Korp, http://urn.fi/urn:nbn:fi:lb-2015040101), licence CC BY 4.0.

The Institute for the Languages of Finland (Kotus) published the printed series Suomen kielen näytteitä (SKN) during the years 1978-2000. A total of 50 booklets appeared, each of which contains the transcripts of one-hour interviews with one female and one male dialect speaker, i.e. approximately two hours of dialect speech. The locations which were selected for the series are well representative of the Finnish dialectal regions. The speakers were born in late 19th century and were generally in their seventies to nineties at the time of the interview.

Using the audio recordings in the Audio Archive of Finnish at Kotus, a database was created for the LAT platform, containing both the audio recordings and the text aligned with audio.

The original audio recordings have been processed by Sakari Pietarila. The text and audio have been manually aligned by My Sjöholm, Pauliina Liuska and Olli Miettinen. The file conversions for LAT were performed by Mietta Lennes. The normalized word readings have been created by Maria Vilkuna, Pauliina Liuska and Pinja Ruponen.

View resource description in all available languages

Korpus on saatavilla Kielipankissa (LAT: http://urn.fi/urn:nbn:fi:lb-1001100134, Korp: http://urn.fi/urn:nbn:fi:lb-2015040101), lisenssi CC BY 4.0.

Kotimaisten kielten tutkimuskeskus (nyk. Kotimaisten kielten keskus) julkaisi Suomen kielen näytteitä (SKN) -sarjaa vuosina 1978–2000. Yhteensä ilmestyi 50 kirjasta, joissa jokaisessa on litteroituna noin kaksi tuntia murretta. Sarjaan valitut pitäjät edustavat kattavasti eri murrealueita. Aineistona ovat olleet pääasiassa Suomen kielen nauhoitearkiston äänitteet. Alkuperäisestä SKN-sarjasta on luotu tämä LAT-tietokanta, joka sisältää sekä äänitteet että niihin kohdistetun tekstin.

Korpuksen litteraatioita voi selailla ja äänitteitä kuunnella verkon kautta. Ääni- ja annotaatiotiedostoja voi myös ladata yksitellen omalle koneelleen.

Tekstin ja äänen kohdistus on tehty karkeasti virkkeen tai puheenvuoron mittaisissa pätkissä. Lisäksi jokaiseen alkuperäisen litteraation sanaan on liitetty alustava yleiskielinen muoto. Huomaa kuitenkin, että yleiskielistys on suuntaa-antava ja tarkoitettu vain hakujen helpottamiseksi.

Alkuperäisen ääniaineiston on käsitellyt Sakari Pietarila. Tekstin ja äänen ovat Kotuksessa kohdistaneet My Sjöholm, Pauliina Liuska ja Olli Miettinen. Äänitteet ja kohdistetut annotaatiotiedostot on muuntanut LAT-järjestelmää varten Mietta Lennes. Yleiskielistyksestä ovat vastanneet Kotuksessa Maria Vilkuna, Pauliina Liuska ja Pinja Ruponen.

You don’t have the permission to edit this resource.