The Suomi 24 Sentences Corpus (2017H2)

View resource name in all available languages

Suomi 24 virkkeet -korpus (2017H2)

Suomi24-korp-2017H2

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2019021101

Access location:

The corpus contains all the discussion forums of the Suomi24 online social networking website from 1st January 2001 to 31st December 2017 available in the Suomi24 API.

Researchers who have a user name and a password can download the entire corpus (http://urn.fi/urn:nbn:fi:lb-2019010801) at http://urn.fi/urn:nbn:fi:lb-2019010802

NB! 2019-09-02 Discrepancies in dependency parses: The dependency parses In Suomi24 Corpus 2017H2 and relations differ significantly from the parses in other corpora parsed earlier with the same parser. We are investigating the issue. If you need dependency parse information, we recommend using Suomi24 2016H2.

View resource description in all available languages

Aineisto sisältää Suomi 24 keskustelupalvelun kaikki Suomi24 APIssa saatavilla olevat keskustelupalstat ajalta 1.1.2001–31.12.2017.

Keskustelujen sisältö esitetään enintään kappaletasolla, ei kokonaisina kommentteina (viesteinä) tai kommenttiketjuina.

Tutkijat voivat myös ladata käyttöönsä koko Suomi24-aineiston Kielipankin latauspalvelusta, ks. http://urn.fi/urn:nbn:fi:lb-2019010802

HUOM! 2019-09-02: Aineiston dependenssijäsennykset ja -relaatiot poikkeavat merkittävästi Suomi24 2016H2 -aineiston ja muiden samalla jäsentimellä jäsennettyjen aineistojen jäsennyksistä. Selvitämme asiaa. Jos tarvitset dependenssijäsennystietoja, sanakuvaa tai nimientunnistustietoja, käytä toistaiseksi vanhempaa Suomi24 2016H2 -aineistoa.

You don’t have the permission to edit this resource.