Oulu Corpus

View resource name in all available languages

Oulun korpus

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-201403266

The corpus is available in Kielipankki - the Language Bank of Finland (taito-shell.csc.fi, access rights instructions: https://kitwiki.csc.fi/twiki/bin/view/FinCLARIN/KielipankkiAccessRights).

The Oulu Corpus is a research material of the standard Finnish language in 1960's. Its collection was led by prof. Pauli Saukkonen. The research material was converted later, in 1997, into an SGML format by the Research Institute for the Languages of Finland.

The corpus project aimed at creation of a corpus that contains a representative sample of the Finnish language in the 1960's media. The corpus does not include the language as used in television.

The corpus can be divided into the following genres:

- fiction literature published in 1961 - 1967
- radio talks during 29 September 1968 - 26 May 1969
- newspapers and journals in 1967
- non-fiction literature 1961 - 1967

It has been grammatically annotated using CQP (Corpus Query Processor).

Details on license are available at http://urn.fi/urn:nbn:fi:lb-20150304136

The purpose of the resource use must be outlined in a research plan.

More information on the corpus: http://urn.fi/urn:nbn:fi:lb-2014060311


log
26.11.2018 linkki http://islrn.org/resources/875-594-014-737-2 poistettu

View resource description in all available languages

Aineisto on saatavilla Kielipankin sovelluspalvelimella (taito-shell.csc.fi, käyttöoikeuksien hakemisesta ks. http://www.kielipankki.fi/KielipankkiKayttooikeudet).

Oulun korpus on 1960-luvun suomen yleiskielen sähköinen tutkimusaineisto, joka on tutkimuskeskuksessa muunnettu SGML-muotoon. Ulkopuoliset tutkijat voivat käyttää Oulun korpusta tutkimustarkoituksiin CSC:n Kielipankissa.

Aineisto on muutettu siitä analysoidusta tekstimateriaalista, joka alun perin
koottiin Oulussa Suomen kielen taajuussanastoa varten. Tekstimateriaaliin
kuului

1) vuosina 1961-1967 ilemestynyt suomenkielinen kaunokirjallisuus
2) radiolle tarkoitetut puheohjelmat 29.9.1968 - 26.5.1969
3) 1967 ilmestyneet sanoma- ja aikakauslehdet
4) vuosina 1961-1967 ilmestynyt suomenkielinen tietokirjallisuus

Tekstit ovat satunnaisesti valittuja otoksia.

Annotointi on tehty CQP:n (Corpus Query Processor) avulla.

Tarkemmat tiedot lisenssistä löytyvät osoitteesta http://urn.fi/urn:nbn:fi:lb-20150304136

Kielivaran käyttötarkoitus tulee määritellä tutkimussuunnitelmassa.


log
26.11.2018 link http://islrn.org/resources/875-594-014-737-2 removed

You don’t have the permission to edit this resource.