Murreaineistot

Itämerensuomalainen kielikartasto

Lataa koko aineisto: CSV SHAPE-ZIP

Itämerensuomalainen kielikartasto (IMSK) eli Atlas Linguarum Fennicarum (ALFE) on syntynyt suomalais-virolais-karjalaisena yhteistyöhankkeena ja ilmestynyt painettuna kolmessa osassa vuosina 2004, 2007 ja 2010. Toimittamisesta ovat vastanneet Kotimaisten kielten (tutkimus)keskus, Eesti Keele Instituut ja Venäjän Tiedeakatemian Karjalan tiedekeskuksen Kielen, kirjallisuuden ja historian instituutti. Tietokantamuotoiseksi aineistoksi kartasto on muokattu Kotimaisten kielten keskuksessa Avoin data ja paikkatieto -projektissa ja sen jatkoprojektissa vuosina 2013 ja 2014.

Itämerensuomalainen kielikartasto keskittyy pääasiassa sanastoilmiöihin, ja sen tavoitteena on kuvata itämerensuomalaisten kielten keskinäisiä suhteita sekä kontakteja naapurikieliin. Kielenilmiöiden levikit kuvastavat itämerensuomalaisten kielten jakautumista nykyisiksi tytärkieliksi. Sanasto liittyy kiinteästi myös kielenulkoisiin kulttuuri-ilmiöihin, joten kartasto palvelee myös kulttuurimaantiedettä.

Kartoissa kuvattavat tiedot on kerätty 317 kysymystä sisältävän kyselysarjan perusteella. Aihepiirit kattavat painetun kartaston johdannon sanoin ”koko alkukantaisen inhimillisen elämän alan”. Kysymyksistä valtaosa on onomasiologisia, eli ne kartoittavat tietyn käsitteen nimityksiä, kuten ilmasuuntien tai viikonpäivien nimityksiä. Osin kartoitetaan alkuperältään saman sanan alueittain vaihtelevia muotoja ja merkityksiä. Kartasto sisältää monentyyppisiä karttoja, ja kaikkiin karttoihin liittyy yksityiskohtainen kommenttiosuus, joka selittää kartoissa kuvattavia ilmiöitä ja niiden variaatiota. (Verkkosovellus sisältää vain karttojen sisältämän tiedon, mutta sovelluksen karttatasolta on ladattavissa painetun kartaston 2. ja 3. osasta pdf:nä kartta ja siihen liittyvä seliteosa. 1. osan pdf:t julkaistaan myöhemmin vuonna 2015.)

Usein kartoituksen tulos on jaettu useaksi kartaksi, esimerkiksi MAHLA-formatiivi kuvataan kolmessa kartassa, joista kaksi ensimmäistä (117.1 ja 117.2) esittelee eri äänneasut (mahla ym.) ja kolmas (117.3) äänneasujen eri merkitysryhmät; ’lehtipuiden rungossa virtaavan nesteen’ lisäksi MAHLA voi tarkoittaa itämerensuomalaisissa kielissä ’nilaa’, ’verta’ tai ’räkää’.

Kartaston kartat jakautuvat seuraaviin päätyyppeihin:

1) Onomasiologiset eli leksikaaliset kartat kuvaavat eri kielten tunteman yhteisen käsitteen nimityksiä. Onomasiologinen karttatyyppi on kartastossa selvästi yleisin.

2) Formatiivikartat kuvaavat kielenilmiön, erityisesti sanan muodon levikkiä. Formatiivilla tarkoitetaan sanan äänteellisen hahmon yleistystä, ”etymologista sanaa”, esimerkiksi LÄMMIN-formatiivi on yleistys sanoista lämmi(n), lämmyn, lämi, lämmi jne. Formatiivit on pääsääntöisesti kirjoitettu versaalikirjaimin. Pelkän formatiivin levikin lisäksi voidaan kuvata myös formatiivin kattamien sanojen äänne- ja muotopiirteiden levikkejä ja semantiikkaa. Usein karttoihin on yhdistetty kahden tai useamman formatiivin tiedot.

3) Semanttiset kartat havainnollistavat sanan eri merkitysten levikkiä, esimerkiksi formatiivilla HAKO (suomen hako, viron haga) on seuraavia merkityksiä: ’havupuun lehvä’, ’maatunut tai veteen kaatunut puu’, ’oksa’, ’neulanen’. Jos kyseessä on semanttinen kartta, tämä on usein kerrottu kartan otsikkotiedoissa.

4) Motiivi- eli miellekartat kuvaavat käsitteen taustalla olevaa yhteistä motiivia, esimerkiksi perunan nimitys voi perustua ”päärynän” (peruna < muinaisruotsi, vrt. nykyruotsin päron ’päärynä’, jord/päron ’maapäärynä = peruna’), ”omenan” (maaomena), ”nauriin” (na˒ggõrz) tai ”munan” (maamuna) nimitykseen. Jos kyseessä on motiivikartta, tämä on usein kerrottu kartan otsikkotiedoissa.

Edellä kuvattujen karttatyyppien lisäksi painetun kartaston johdannossa mainitaan frekvenssi- eli tilastokartat sekä ideaalityyppi- eli rekonstruktiokartat, mutta näitä karttatyyppejä ei juuri esiinny.

Kartasto kuvaa 1900-luvun alun kielimuotoa. Tiedot on kerätty 259 perushavaintopisteestä eli kartoituspisteestä, jotka jakautuvat kielittäin seuraavasti: suomi 185, karjala 29, vepsä 7, inkeroinen 3, vatja 3, viro 30 ja liivi 3. Tietoja on hankittu sekä arkistoista että kenttäkeruin. Suomen ja viron tiedot perustuvat yksinomaan arkistojen kokoelmiin, ja karjalan ja vepsän tiedot ovat lähes kokonaan kenttäkeruun tulosta.

Sähköinen kartasto noudattaa painetun kartaston hierarkiaa ja kuvaustapaa, mistä aiheutuu muun muassa tietojen toisteisuutta. Käytännössä tämä näkyy esimerkiksi kartoissa, jotka kuvaavat ’muikun’ (Coregonus albula) nimityksiä. Ensimmäisessä kartassa esitetään eri nimitysten levikit formatiivitasolla (muikku, rääpys, maiva, silli) ja seuraavissa kartoissa kuvataan muikun ja rääpyksen eri muotojen levikit, jolloin MUIKKU-levikki (256.1) on sama kuin muikku ja muje -muotojen yhteislevikki (256.2) ja RÄÄPYS-levikki on sama kuin rääpys, rääppö/rääpöi, rääbis, rääpus ja rääpyskä -muotojen yhteislevikki (256.3).

Kettusen murrekartasto

Lataa koko aineisto: CSV SHAPE-ZIP

Lauri Kettusen murrekartasto on ilmestynyt alun perin Suomalaisen Kirjallisuuden Seuran kustantaman Suomen murteet -teossarjan osana. I osassa (1930) Kettunen julkaisi keräämiään murrenäytteitä, II osassa (1930) hän kuvasi suomen murrealueet, ja III osa (1940) on kahteen niteeseen jakautuva murrekartasto. Osa III A sisältää 213 karttaa ja osa III B karttoihin kuuluvat yksityiskohtaiset selitykset. Murrekartasto III B on teossarjan tunnetuin osa, ja siitä on myöhemmin julkaistu supistettu laitos, joka on edelleen myynnissä. Kettusen murrekartasto kuvaa suomen murteita toista maailmansotaa edeltävässä muodossaan, mutta tästä huolimatta kartasto on edelleen tärkeä murteentutkimuksen lähde.

Kettusen kartasto kuvaa suomen murteiden äänne- ja muoto-opillisia piirteitä. Kartat on jaoteltu äänneopillisin perustein. Pääjako on konsonantismi (kartat 1–140) ja vokalismi (kartat 141–213). Karttojen otsikointi on Kettusen kartaston sisällysluettelon mukainen. (Verkkosovelluksessa sisällysluettelon saa näkymään, kun valitsee aineistoksi Kettusen murrekartaston ja hakee kaiken siihen liittyvän.) Kettusen alkuperäisenä tarkoituksena oli sisällyttää kartastoon myös parikymmentä leksikaalisia eroja valaisevaa karttaa, mutta ne eivät mahtuneet mukaan.

Kettusen karttojen sisältö on siirretty tietokantamuotoon 1990-luvun lopussa Kanadassa Yorkin yliopistossa Sheila Embletonin ja Eric S. Wheelerin johtamassa Finnish Dialect Atlas Project -hankkeessa Social Sciences and Humanities Research Council of Canadan rahoituksella. Kotimaisten kielten keskus sai aineiston vuonna 2000. Aineisto tarkastettiin ja muokattiin nykyiseen asuunsa vuodesta 2009 alkaen Urho Määtän johtamassa ja Koneen Säätiön rahoittamassa BEDLAN-tutkimushankkeessa (Biological Evolution and the Diversification of Languages Project). Pääosin Jyri Lehtisen suorittama muokkaustyö on tehty Kotimaisten kielten keskuksessa. Finnish Dialect Atlas Project ja Kotimaisten kielten keskus ovat sopineet vuonna 2013 aineiston vapaasta verkkokäytöstä, ja julkaisemiseen liittyvät tekijänoikeuskysymykset on selvitetty.

Verkkosovelluksesta on ladattavissa myös painetun kartaston kartat pdf-tiedostoina.

Suomen murteiden sanakirjan levikkikartat

Lataa koko aineisto: CSV SHAPE-ZIP

Kotimaisten kielten keskuksessa toimitetaan Suomen murteiden sanakirjaa. Toimityön yhteydessä laaditaan valikoidusti murresanojen levikkikarttoja. Levikkikartta kuvaa Suomen murteiden sana-arkiston kokoelmista saadut luotettavat sanatiedot pitäjittäin.

Suomen murteiden sanakirjan verkkoversio: http://kaino.kotus.fi/sms/

Lisätietoja levikkikartoista: http://kaino.kotus.fi/sms/?p=help#levikkikartat

Svenska ortnamn i Finland

Lataa koko aineisto: CSV SHAPE-ZIP

Svenska ortnamn i Finland (SOF) on Kotimaisten kielten keskuksen toimittama julkaisu, johon on koottu Suomen keskeinen ruotsinkielinen nimistö suomenkielisine rinnakkaisnimineen. Aineisto on ladattavissa AVAA-palvelusta, mutta sen käyttöliittymä on Kotimaisten kielten keskuksen verkkopalvelussa.

Aineiston käyttöliittymä: http://kaino.kotus.fi/svenskaortnamn/

Lisätietoja SOFista: http://kaino.kotus.fi/svenskaortnamn/?a=omsof

Paikannimikartasto

Lataa koko aineisto: CSV SHAPE-ZIP

Paikannimikartasto on Suomen suomenkielisten paikannimien levikkejä esittelevä sähköinen kartasto, johon nimitiedot on poimittu Kotimaisten kielten keskuksen Nimiarkiston kokoelmista vuosina 1997–2002. Kartasto sisältää yhteensä 234 keskeistä paikannimielementtiä. Nimiesiintymiä aineistossa on yhteensä noin 90 000. Aineisto edustaa vain vajaata 4 % Kotimaisten kielten keskuksen Nimiarkiston paikannimikokoelmista. Aineisto on ladattavissa AVAA-palvelusta, mutta sen käyttöliittymä on Kotimaisten kielten keskuksen verkkopalvelussa.

Aineiston käyttöliittymä: http://kaino.kotus.fi/nikar/

Lisätietoja Paikannimikartastosta: http://www.kotus.fi/julkaisut/nimijulkaisut/paikannimijulkaisut/paikannimikartasto