Iijoki, the University of Oulu Päätalo collection, Kielipankki Korp version 
View resource name in all available languages
Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki Korp -versio
iijoki-korp
Persistent Identifier of this resource:
http://urn.fi/urn:nbn:fi:lb-2019102101
Access location:
Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401 ja Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/
Aineiston on julkaistu konkordanssityökalu Korpissa http://urn.fi/urn:nbn:fi:lb-2019102102
Sarjan 26 kirjaa on jäsennetty Kielipankissa kahdella eri jäsentimellä. Molemmat julkaistaan Kielipankin Korp-konkordanssipalvelussa (korp.csc.fi).
Tämä versio on jäsennetty Turku Neural Parser Pipeline (TNPP) -jäsentimellä. Se on Turun yliopistossa TurkuNLP-hankeessa kehitetty neuroverkkojäsennin, tarkemmat tiedot löytyvät sivulta http://turkunlp.org/Turku-neural-parser-pipeline/
Aineisto sisältää murresanoja, jotka jäsennin on perusmuotoistanut, mutta jotka eivät aina tuota yleiskielisen vastaavan sanan tapaista perusmuotoa. TNPP-jäsennys tuottaa kuitenkin aina jonkin perusmuodon jokaiselle saneelle. Sen vuoksi aineisto on jäsennetty myös TDPP-jäsentimellä, jonka tuloksena on saatu lista saneista, joita TDPP-jäsennin ei ole käytettävissä olevien tietolähteiden perusteella kyennyt tunnistamaan ja parusmuotoistamaan. Näiden saneiden juokko sisältää murresanojen lisäksi myös muita tunnistamattomia saneita, mm. erisnimiä. Lista kaikista TDPP-jäsentimen tuottamista tunnistamattomista saneista (pintamuodot) sekä 200 yleisimmästä tämän listan sisältämästä murresanasta (perusmuodot) löytyvät Oulun yliopiston Päätalo-kokoelman tietosivulta https://www.kielipankki.fi/oulun-yliopiston-paatalo-kokoelma/
Aineiston on julkaistu konkordanssityökalu Korpissa http://urn.fi/urn:nbn:fi:lb-2019102102
Sarjan 26 kirjaa on jäsennetty Kielipankissa kahdella eri jäsentimellä. Molemmat julkaistaan Kielipankin Korp-konkordanssipalvelussa (korp.csc.fi).
Tämä versio on jäsennetty Turku Neural Parser Pipeline (TNPP) -jäsentimellä. Se on Turun yliopistossa TurkuNLP-hankeessa kehitetty neuroverkkojäsennin, tarkemmat tiedot löytyvät sivulta http://turkunlp.org/Turku-neural-parser-pipeline/
Aineisto sisältää murresanoja, jotka jäsennin on perusmuotoistanut, mutta jotka eivät aina tuota yleiskielisen vastaavan sanan tapaista perusmuotoa. TNPP-jäsennys tuottaa kuitenkin aina jonkin perusmuodon jokaiselle saneelle. Sen vuoksi aineisto on jäsennetty myös TDPP-jäsentimellä, jonka tuloksena on saatu lista saneista, joita TDPP-jäsennin ei ole käytettävissä olevien tietolähteiden perusteella kyennyt tunnistamaan ja parusmuotoistamaan. Näiden saneiden juokko sisältää murresanojen lisäksi myös muita tunnistamattomia saneita, mm. erisnimiä. Lista kaikista TDPP-jäsentimen tuottamista tunnistamattomista saneista (pintamuodot) sekä 200 yleisimmästä tämän listan sisältämästä murresanasta (perusmuodot) löytyvät Oulun yliopiston Päätalo-kokoelman tietosivulta https://www.kielipankki.fi/oulun-yliopiston-paatalo-kokoelma/
- Turku Neural Parser Pipeline
People who looked at this resource also viewed the following: