Iijoki, the University of Oulu Päätalo collection, Kielipankki TDPP Korp version

View resource name in all available languages

Iijoki, Oulun yliopiston Päätalo-kokoelma, Kielipankki TDPP Korp-versio

iijoki-tdpp-korp

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2019102103

Iijoki-sarjan kuvaus löytyy sivulta http://urn.fi/urn:nbn:fi:lb-2019041401.
Lisenssisivu: http://urn.fi/urn:nbn:fi:lb-2019102106

Sarjan 26 kirjaa on jäsennetty Kielipankissa kahdella eri jäsentimellä. Molemmat julkaistaan Kielipankin Korp-konkordanssipalvelussa (korp.csc.fi).

Tämän aineisto on jäsennetty Turku Dependency Parser Pipeline (TDPP) -jäsentimellä. Se on Turun yliopistossa Bio-NLP-hankeessa tuotetun UD (Universal Dependencies) -jäsentimen (TDT alpha) pohjalta Kielipankissa täydennetty jäsennin. Turku Dependency Treebank-jäsentimestä löytyy tietoa sivulta http://bionlp.utu.fi/fintreebank.html

Aineisto sisältää murresanoja, joiden perusmuotoistamiseen ei ole vakiintuneita keinoja. TDPP-jäsennin jättää pintamuodon tuottamatta, milloin sen käytettävissä ei ole ollut murresanan perusmuotoa. Lista tällaisista pintamuodoista sekä lista 200 yleisimmästä murresanasta frekvensseineen löytyvät Oulun yliopiston Päätalo-kokoelman tietosivu Kielipankin sivustolta osoitteesta https://www.kielipankki.fi/aineistot/oulun-yliopiston-paatalo-kokoelma/

You don’t have the permission to edit this resource.