Raja-Karjalan korpus
Date
2017-02-21Author(s)
Unique identifier
http://urn.fi/urn:nbn:fi:lb-2014073033Metadata
Show full item recordResearch data
Citation
Marjatta Palander, University of Eastern Finland. Helka Riionheimo, University of Eastern Finland. Vesa Koivisto, University of Eastern Finland. Kotimaisten kielten keskus, Institute for the Languages of Finland. , Raja-Karjalan korpus, 2017, http://urn.fi/urn:nbn:fi:lb-2014073033.Licensed under
Abstract
Raja-Karjalan korpus sisältää yht. 119 t 4 min 58 s audiotiedostoja (.wav) sekä niiden suomalais-ugrilaisella tarkekirjoituksella tuotetut transkriptiot, jotka ovat UTF-8-merkistökoodattuja raakatekstitiedostoja (.txt) ja jotka on kohdistettu lausumatasolle äänteitä vastaamattomista merkeistä riisuttuina TextGrid-tiedostoina. Yhteensä aineiston koko on noin 40 GB.
Äänitteet edustavat 1800-luvun lopulla ja 1900-luvun alussa syntyneiden rajakarjalaisten haastattelupuhetta, jota on tallennettu Kotimaisten kielten keskuksen Suomen kielen nauhoitearkiston kokoelmiin pääosin 1960- ja 1970-luvuilla. Näytteet edustavat Ilomantsin, Korpiselän, Suojärven, Suistamon, Impilahden ja Salmin pitäjien murretta.
Korpus on luotu seuraavilla rahoituksilla: Karjalaisen Kulttuurin Edistämissäätiö (hanke Raja-Karjalan karjala, 2009–2011, näytteiden litteroiminen), Suomen Akatemia (hanke Suomen ja karjalan rajalla: näkökulmia lähisukukieliin ja niiden murteisiin [FINKA], 2011–2014, näytteiden litteroiminen ja tarkistaminen), Koneen Säätiö (hanke Suomen itäpuolisten lähialueiden kielikorpukset [SILK], 2013–2015, näytteiden litteroiminen, tarkistaminen ja editointi) ja Karjalaisen Kulttuurin Edistämissäätiö (hanke Raja-Karjalan ja inkerinsuomen murrekorpukset [SILK 2], 2016–2017, litterointien kohdistaminen äänitteisiin).
Korpustyöhön ovat osallistuneet seuraavat opiskelijat ja tutkijat:
Litteroijat:
Niina Makkonen, Henna Massinen, Ilona Paajanen, Laura Piironen (nyk. Arantola) ja Ilja Moshnikov
Litterointien tarkistajat:
Pekka Zaikov, Ilja Moshnikov ja Marjatta Palander
Korpustyöntekijät (editointi, kohdistus):
Ilja Moshnikov ja Lauri Tavi.
Lisätietoja aineistosta: http://www.uef.fi/fi/finka/finka
log
26.11.2018 linkki islrn.org/resources/288-221-011-723-8 poistettu ja sijaintilinkki http://www.uef.fi/fi/finka/finka siirretty kuvausosioon
The Corpus of Border Karelia contains the audio recordings and transcripts of dialects spoken in the area of Border Karelia, where the very closely related varieties of eastern Finnish dialects and Karelian were in contact. The informants are evacuees who were mainly moved to eastern Finland after World War II.
The original interviews were recorded in the 1960s and the 1970s and transcribed at the University of Eastern Finland by various researchers using the Finno-Ugrian transcription system. The interviewees are elderly people who were born in the 1870s - 1910s.
The original material has been archived by the Institute for the Languages of Finland. During the FINKA project (funded by the Academy of Finland in 2011–2014), the transcripts were reviewed and reorganized into a machine-readable corpus that is compatible with modern research tools.
The written transcripts of the corpus will be made accessible through the Korp concordance tool (https://korp.csc.fi). The transcripts are also aligned with the corresponding audio files, and this subset will be made available through the LAT system (http://lat.csc.fi).
More information about the resource: http://www.uef.fi/fi/finka/finka
log
26.11.2018 link islrn.org/resources/288-221-011-723-8 removed and the access location link http://www.uef.fi/fi/finka/finka moved to the description part