digi.kansalliskirjasto.fi
digi.kansalliskirjasto.fi
digi.kansalliskirjasto.fi
Palaute

Ladattavat avoimen datan aineistopaketit ja työkalut

Tältä sivulta löydät Kansalliskirjaston digitoimien sanomalehtien ja aikakauslehtien aineistopaketit. Paketit sisältävät sivukohtaisesti sivun metatiedot, ALTO XML standardin mukaisen rakenneanalyysin ja sivun raakatekstin. Kysymme käyttötarkoituksestasi jonka jälkeen saat henkilökohtaisen latauslinkin valitsemiisi aineistoihin. Tarjoamme lisäksi työkaluja aineistoihin. Lataustyökalun avulla on mahdollista ladata itselleen tekijänoikeudesta vapaaksi katsottuja aineistoja. Jupyter Notebook puolestaan antaa ohjeita, koodeja ja mahdollisuuden käsitellä ladattuja tekstiaineistoja.

Lataustyökalulla voi ladata sanoma- ja aikakauslehtien, pienpainatteiden, kirjojen, käsikirjoitusten ja nuottien aineistoja siltä osin, kuin niiden sisältö katsotaan tekijänoikeudesta valtaosin vapaaksi. Sanomalehtinimekkeiden ocr-laatu voi vaihdella, koska palveluun lisätään vähitellen parempilaatuista materiaalia. Ohjevideo: https://www.youtube.com/watch?v=o-ykh9zTOdI

Käyttöehdot. Käyttäjät eivät saa välittää tekijänoikeuden alaista digitaalista aineistoa eteenpäin ilman oikeudenhaltijan lupaa.
Jos tarvitset muita aineistoja tai tulee kysymyksiä voit antaa palautetta aineistosta Digin yläreunan Palaute-toiminnolla. Usein kysytyt kysymykset aineistopaketeista wikissä.

EU - Euroopan aluekehitysrahasto Vipuvoimaa EU:lta 2014-2020
Digitalia (2017-2019): Digital Humanities in Nordic Countries 2018, Creating and using ground truth OCR sample data for Finnish historical newspapers and journals (Kimmo Kettunen, Jukka Kervinen and Mika Koistinen) (pdf)

Ladattavat aineistot alla on järjestetty projektikokonaisuuksittain ja aineistolajeittain:


Kerro kuinka käytät Kansalliskirjaston avaamaa aineistoa, niin lisäämme salliessasi linkkisi sivustollemme.

Anna sähköpostisi, jos haluat kuulla uusista aineistoista. (Ei julkaista).

Takaisin listaukseen