Finnish Wikipedia 2017, source 
View resource name in all available languages
Suomenkielinen Wikipedia 2017, lähdemateriaali
wikipedia-fi-2017-src
Persistent Identifier of this resource:
http://urn.fi/urn:nbn:fi:lb-2019110803
Access location:
The Finnish Wikipedia 2017 source material corpus is available for download.
The corpus contains all Finnish articles from the online encyclopedia Wikipedia available in 1 January 2018. The text parts of the articles have been extracted from [Wikipedia Dumps](https://dumps.wikimedia.org/) with [WikiExtractor](https://github.com/attardi/wikiextractor).
The corpus has been tokenized and annotated with morpho-syntactic analysis produced with the [Turku Dependency Parser](http://turkunlp.github.io/Finnish-dep-parser/)
License: CC BY https://creativecommons.org/licenses/by/4.0/
View resource description in all available languagesSuomenkielinen Wikipedia 2017 lähdemateriaali on saatavilla Kielipankin latauspalvelussa.
Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin ja lauseisiin. Lauseet on morfosyntaktisesti jäsennetty käyttäen Turku Dependenssi jäsennintä (http://turkunlp.github.io/Finnish-dep-parser/).
Lisenssi: CC BY https://creativecommons.org/licenses/by/4.0/
The corpus contains all Finnish articles from the online encyclopedia Wikipedia available in 1 January 2018. The text parts of the articles have been extracted from [Wikipedia Dumps](https://dumps.wikimedia.org/) with [WikiExtractor](https://github.com/attardi/wikiextractor).
The corpus has been tokenized and annotated with morpho-syntactic analysis produced with the [Turku Dependency Parser](http://turkunlp.github.io/Finnish-dep-parser/)
License: CC BY https://creativecommons.org/licenses/by/4.0/
Suomenkielinen Wikipedia 2017 lähdemateriaali on saatavilla Kielipankin latauspalvelussa.
Aineisto kattaa Wikipedian suomenkielisen artikkelien leipätekstit vuoden 2017 lopulta. Tekstit on eristetty Wikipedian tarjoamista kielikohtaisista kokonaisaineistoista (https://dumps.wikimedia.org/). Aineisto on jaettu arikkeleihin, kappaleisiin ja lauseisiin. Lauseet on morfosyntaktisesti jäsennetty käyttäen Turku Dependenssi jäsennintä (http://turkunlp.github.io/Finnish-dep-parser/).
Lisenssi: CC BY https://creativecommons.org/licenses/by/4.0/
People who looked at this resource also viewed the following: