{"id":4001,"date":"2019-06-27T14:22:29","date_gmt":"2019-06-27T11:22:29","guid":{"rendered":"https:\/\/blogit.utu.fi\/suomenhistoria\/?p=4001"},"modified":"2019-06-27T14:22:29","modified_gmt":"2019-06-27T11:22:29","slug":"muuttaako-koneluenta-kasinkirjoitettujen-aineistojen-tutkimusta","status":"publish","type":"post","link":"https:\/\/blogit.utu.fi\/suomenhistoria\/muuttaako-koneluenta-kasinkirjoitettujen-aineistojen-tutkimusta\/","title":{"rendered":"Muuttaako koneluenta k\u00e4sinkirjoitettujen aineistojen tutkimusta?"},"content":{"rendered":"<p>Kansallisarkistossa j\u00e4rjestettiin 26.6.2019 k\u00e4sinkirjoitetun tekstin koneluentaan keskittynyt <em>Reading and Enrichment of Archival Documents<\/em> (<a href=\"https:\/\/read.transkribus.eu\/\">READ<\/a>) -hankkeen p\u00e4\u00e4t\u00f6sseminaari. Hanke on Euroopan Unionin rahoittama (Horizon 2020) konsortio ja se on ollut k\u00e4ynniss\u00e4 tammikuusta 2016 ja p\u00e4\u00e4ttyy nyt kes\u00e4kuun lopussa. Hanketta on johdettu Innsbruckin yliopistosta. Suomesta hankkeessa on ollut mukana <a href=\"https:\/\/www.arkisto.fi\/fi\/kansallisarkisto\/hankkeet\/read\">Kansallisarkisto<\/a>.<\/p>\n<p>Seminaarissa esiteltiin aamup\u00e4iv\u00e4ll\u00e4 hankkeessa kehitetty\u00e4 Transkribus-sovellusta, josta my\u00f6hemmin lis\u00e4\u00e4. Iltap\u00e4iv\u00e4n esitelm\u00f6itsij\u00e4t Svenska Litteraturs\u00e4llskapet i Finlandista (SLS), Amsterdamin kaupungin arkistosta sek\u00e4 Kansallisarkistosta kertoivat kokemuksiaan sovelluksen k\u00e4yt\u00f6st\u00e4 erilaisten arkistomateriaalien kanssa. P\u00e4iv\u00e4n lopuksi eri alojen asiantuntijoista koostettu paneeli keskusteli yleisesti Transkribuksesta sek\u00e4 arkistojen ja arkistoaineistojen digitalisoitumisesta.<\/p>\n<p>Yksi READ-hankkeen merkitt\u00e4vimmist\u00e4 tuloksista on <a href=\"https:\/\/transkribus.eu\/\">Transkribus<\/a>-sovellus, joka lukee k\u00e4sinkirjoitettua teksti\u00e4 ja mahdollistaa monenlaisen ty\u00f6skentelyn k\u00e4sinkirjoitettujen dokumenttien kanssa. Ohjelman avulla voi esimerkiksi opetella lukemaan eri aikakausien k\u00e4sialoja, mutta tutkijoille ja muille historiallisten k\u00e4sinkirjoitettujen aineistojen kanssa aikaansa viett\u00e4ville Transkribus tarjoaa mahdollisuuden uudenlaiseen ty\u00f6skentelyyn l\u00e4hteiden parissa.<\/p>\n<div id=\"attachment_4010\" style=\"width: 321px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-4010\" class=\"wp-image-4010 \" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/V\u00e4lim\u00e4ki_TranskribusWolpertinger-266x300.jpg\" alt=\"\" width=\"311\" height=\"351\" srcset=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/V\u00e4lim\u00e4ki_TranskribusWolpertinger-266x300.jpg 266w, https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/V\u00e4lim\u00e4ki_TranskribusWolpertinger.jpg 700w\" sizes=\"auto, (max-width: 311px) 100vw, 311px\" \/><p id=\"caption-attachment-4010\" class=\"wp-caption-text\">Transkribuksen yhteydess\u00e4 on k\u00e4ytetty kuvituksena Albrect D\u00fcrerin luomaa wolpertinger-olentoa eli j\u00e4nist\u00e4, jolla on siivet ja sarvet. Kuva: Wikimedia Commons<\/p><\/div>\n<p>Transkribus-sovelluksen voi ladata ilmaiseksi ja sovelluksen internetsivuilta l\u00f6ytyv\u00e4t selke\u00e4t ohjeet ohjelman k\u00e4yt\u00f6st\u00e4. Sovelluksen k\u00e4ytt\u00e4j\u00e4ll\u00e4 tulee olla hallussaan tutkittava materiaali kuvina. Kuvat ladataan ohjelmaan ja t\u00e4m\u00e4n j\u00e4lkeen Transkribus koulutetaan tunnistamaan kyseisille dokumenteille ominaiset tekstialueet ja lukemaan kyseist\u00e4 k\u00e4sialaa eli luodaan malli, jota sovellus k\u00e4ytt\u00e4\u00e4 teksti\u00e4 lukiessaan.<\/p>\n<p>Ohjelmaa tulee kouluttaa v\u00e4hint\u00e4\u00e4n noin sadan sivun verran lukemaan tietty\u00e4 k\u00e4sialaa. Luotua mallia voidaan soveltaa muuhun samankaltaiseen ja samalta ajalta olevaan aineistoon ja eri malleja voidaan Transkribuksessa my\u00f6s yhdist\u00e4\u00e4. T\u00e4llaisia malleja on jo luotu erilaisiin aineistoihin keskiaikaisista dokumenteista 1900-luvun materiaaleihin. Parhaan mahdollisen tuloksen saamiseksi, kannattaa kuitenkin edelleen luoda oma malli sille aineistolle, jonka kanssa ty\u00f6skentelee ellei aineisto muistuta l\u00e4heisesti jotain jo ohjelmaan viety\u00e4 aineistoa.<\/p>\n<p>Yksi t\u00e4llainen luotu malli on tehty suomalaisten 1800-luvun tuomiokirjojen ilmoitusasioista ja sit\u00e4 voidaan k\u00e4ytt\u00e4\u00e4 my\u00f6s laajemmin 1800-luvun tuomiokirjamateriaaliin. Tulokset t\u00e4m\u00e4n mallin k\u00e4yt\u00f6st\u00e4 ovat olleet erinomaisia ja mallin tekemien virheiden m\u00e4\u00e4r\u00e4 on v\u00e4h\u00e4inen. Seminaarissa tuotiinkin esiin, ett\u00e4 Transkribusta on onnistuttu kehitt\u00e4m\u00e4\u00e4n kahden viime vuoden aikana niin, ett\u00e4 ohjelman lukutulos on parantunut huomattavasti. Joskin useat osallistuvat muistuttivat, ettei ole tarkoituskaan pyrki\u00e4 virheett\u00f6m\u00e4\u00e4n suoritukseen.<\/p>\n<p>Transkribus mahdollistaa tekstimassan muuttamisen k\u00e4sinkirjoitetusta koneymm\u00e4rrett\u00e4v\u00e4\u00e4n muotoon (analogisesta aineistosta aidosti digitaaliseksi) sek\u00e4 muun muassa avainsanahaun sovellukseen ladattuihin aineistoihin. Esimerkiksi 1800-luvun tuomiokirjamateriaaliin voidaan tehd\u00e4 hakuja henkil\u00f6n ja paikannimill\u00e4 tai esimerkiksi rikosnimikkeill\u00e4. Tuomiokirjatutkijana n\u00e4m\u00e4 mahdollisuudet tuntuvat suorastaan h\u00e4kellytt\u00e4v\u00e4n hienoilta.\u00a0 Kansallisarkiston tavoitteena on, ett\u00e4 1800-luvun tuomiokirjamateriaalit tulisivat yleis\u00f6n k\u00e4ytt\u00f6\u00f6n syksyn 2019 aikana.<\/p>\n<p>Vanhempien aikojen ja erityisesti 1600-luvun kaupunkihistoriaan keskittyv\u00e4n\u00e4 tutkijana, toivoisin todella, ett\u00e4 Kansallisarkistossa k\u00e4ynnistett\u00e4isiin vastaava projekti my\u00f6s 1600- ja 1700-lukujen tuomiokirjamateriaaleille, jotka muodostavat yhden merkitt\u00e4vimmist\u00e4 l\u00e4hderyhmist\u00e4mme kyseisilt\u00e4 vuosisadoilta. Tuomiokirjatutkimusta 1600-luvun osalta toki helpottaa jo pitk\u00e4\u00e4n k\u00e4yt\u00f6ss\u00e4 ollut ja digitoitu Tuomiokirjakortisto eli <a href=\"http:\/\/wiki.narc.fi\/portti\/index.php\/Tuomiokirjakortisto_(Tuokko)\">Tuokko<\/a>, mutta Tuokko koskee vain osaa Suomen alueella toimineista tuomioistuimista eik\u00e4 se sis\u00e4ll\u00e4 lainkaan kaupunkeja. Kaupunkien osalta tuomiokirjoista tietoa etsitt\u00e4ess\u00e4 tulee kirjoja edelleen selata sivu sivulta l\u00f6yt\u00e4\u00e4kseen tarvitsemansa informaation. Toki useimmissa kaupunkien tuomioistuinten tuomiokirjoissa on henkil\u00f6hakemisto, mutta se ei helpota tutkimusta juurikaan.<\/p>\n<p>Uuden ajan alun tuomiokirjamateriaalien vieminen Transkribukseen mahdollistaisi tutkimuksen teon n\u00e4ill\u00e4 aineistoilla entist\u00e4 monipuolisemmin ja tekisi tuomiokirjamateriaalista l\u00e4hestytt\u00e4v\u00e4mm\u00e4n l\u00e4hderyhm\u00e4n opiskelijoille, tutkijoille ja sukututkijoille. Valitettavasti suureksi kysymykseksi nousee t\u00e4ss\u00e4kin raha. Kansallisarkistossa aineistoista ja niiden digitoinnista vastaava johtaja Istvan Kecskemeti totesikin paneelikeskustelussa, ett\u00e4 Kansallisarkisto tarvitsee lis\u00e4\u00e4 rahoitusta, jotta asiakirjoja saadaan digitoitua ja n\u00e4in laajemmin tutkijoiden ja muiden arkistonk\u00e4ytt\u00e4jien k\u00e4ytt\u00f6\u00f6n.<\/p>\n<div id=\"attachment_4004\" style=\"width: 710px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-4004\" class=\"wp-image-4004\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/Transkribus_Gunther-1024x768.jpg\" alt=\"\" width=\"700\" height=\"525\" srcset=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/Transkribus_Gunther-1024x768.jpg 1024w, https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/Transkribus_Gunther-300x225.jpg 300w, https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2019\/06\/Transkribus_Gunther-768x576.jpg 768w\" sizes=\"auto, (max-width: 700px) 100vw, 700px\" \/><p id=\"caption-attachment-4004\" class=\"wp-caption-text\">G\u00fcnther M\u00fchlberger Inssbruckin yliopistosta kertomassa READ COOP -yrityksest\u00e4 Transkribus-seminaarissa. Kuva: Mari V\u00e4lim\u00e4ki<\/p><\/div>\n<p>Nyt kun READ-hankkeen EU-rahoitus on p\u00e4\u00e4ttym\u00e4ss\u00e4, on perustettu yritys nimelt\u00e4 <a href=\"https:\/\/read.transkribus.eu\/coop\/\">READ-COOP<\/a>, jolla Transkribus-sovelluksen tulevaisuus turvataan. Kansallisarkisto on mukana yhten\u00e4 perustajaj\u00e4senen\u00e4 uudessa kansainv\u00e4lisess\u00e4 yrityksess\u00e4. Tarkoitus on, ett\u00e4 tulevaisuudessakin yksityiset henkil\u00f6t voisivat k\u00e4ytt\u00e4\u00e4 Transkribusta ilmaiseksi, mutta suurille toimijoille kuten arkistoille on tulossa maksu laajojen aineistojen siirt\u00e4misest\u00e4 Transkribukseen. T\u00e4ss\u00e4kin on siis kyse rahasta. Todella toivon, ett\u00e4 Kansallisarkisto saa Kecskemetin per\u00e4\u00e4nkuuluttamaa rahoitusta, jotta k\u00e4sinkirjoitettujen aineistojen k\u00e4ytett\u00e4vyys laajenisi, monipuolistuisi ja paranisi tulevaisuudessa.<\/p>\n<p>T\u00e4h\u00e4n suuntaan ollaan jo toki menossa, kun Kansallisarkistossa READ-hankkeen kautta saatuja konkreettisia tuloksia jatkoty\u00f6stet\u00e4\u00e4n ja saatetaan yleis\u00f6n k\u00e4ytt\u00f6\u00f6n Opetus- ja kulttuuriministeri\u00f6n rahoittamassa <a href=\"https:\/\/makingamodernarchive.blogspot.com\/\">Making a Modern Archive<\/a> -hankkeessa. Toivottavasti t\u00e4m\u00e4 on vasta alkua ja tulevaisuudessa n\u00e4emme my\u00f6s laajojen vanhempien aikojen aineistokokonaisuuksien tulevan koneluettuna yleis\u00f6n k\u00e4ytt\u00f6\u00f6n.<\/p>\n<p>&nbsp;<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone  wp-image-882\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2017\/03\/Marin-kuva-300x300.png\" alt=\"\" width=\"171\" height=\"171\" srcset=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2017\/03\/Marin-kuva-300x300.png 300w, https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2017\/03\/Marin-kuva-150x150.png 150w, https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/uploads\/sites\/101\/2017\/03\/Marin-kuva.png 720w\" sizes=\"auto, (max-width: 171px) 100vw, 171px\" \/><\/p>\n<p>Mari V\u00e4lim\u00e4ki<br \/>\nKirjoittaja on Suomen historian tohtorikoulutettava<\/p>\nJAA ARTIKKELI:    <a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-facebook nolightbox\" data-provider=\"facebook\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Facebook\" href=\"https:\/\/www.facebook.com\/sharer.php?u=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-json%2Fwp%2Fv2%2Fposts%2F4001&#038;t=Muuttaako%20koneluenta%20k%C3%A4sinkirjoitettujen%20aineistojen%20tutkimusta%3F&#038;s=100&#038;p&#091;url&#093;=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-json%2Fwp%2Fv2%2Fposts%2F4001&#038;p&#091;images&#093;&#091;0&#093;=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-content%2Fuploads%2Fsites%2F101%2F2019%2F06%2FV%C3%A4lim%C3%A4ki_TranskribusWolpertinger-266x300.jpg&#038;p&#091;title&#093;=Muuttaako%20koneluenta%20k%C3%A4sinkirjoitettujen%20aineistojen%20tutkimusta%3F\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"Facebook\" title=\"Share on Facebook\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/plugins\/social-media-feather\/synved-social\/addons\/extra-icons\/image\/social\/balloon\/96x96\/facebook.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-twitter nolightbox\" data-provider=\"twitter\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Twitter\" href=\"https:\/\/twitter.com\/intent\/tweet?url=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-json%2Fwp%2Fv2%2Fposts%2F4001&#038;text=Hey%20check%20this%20out\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"twitter\" title=\"Share on Twitter\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/plugins\/social-media-feather\/synved-social\/addons\/extra-icons\/image\/social\/balloon\/96x96\/twitter.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-pinterest nolightbox\" data-provider=\"pinterest\" target=\"_blank\" rel=\"nofollow\" title=\"Pin it with Pinterest\" href=\"https:\/\/pinterest.com\/pin\/create\/button\/?url=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-json%2Fwp%2Fv2%2Fposts%2F4001&#038;media=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-content%2Fuploads%2Fsites%2F101%2F2019%2F06%2FV%C3%A4lim%C3%A4ki_TranskribusWolpertinger-266x300.jpg&#038;description=Muuttaako%20koneluenta%20k%C3%A4sinkirjoitettujen%20aineistojen%20tutkimusta%3F\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px;margin-right:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"pinterest\" title=\"Pin it with Pinterest\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/plugins\/social-media-feather\/synved-social\/addons\/extra-icons\/image\/social\/balloon\/96x96\/pinterest.png\" \/><\/a><a class=\"synved-social-button synved-social-button-share synved-social-size-48 synved-social-resolution-single synved-social-provider-linkedin nolightbox\" data-provider=\"linkedin\" target=\"_blank\" rel=\"nofollow\" title=\"Share on Linkedin\" href=\"https:\/\/www.linkedin.com\/shareArticle?mini=true&#038;url=https%3A%2F%2Fblogit.utu.fi%2Fsuomenhistoria%2Fwp-json%2Fwp%2Fv2%2Fposts%2F4001&#038;title=Muuttaako%20koneluenta%20k%C3%A4sinkirjoitettujen%20aineistojen%20tutkimusta%3F\" style=\"font-size: 0px;width:48px;height:48px;margin:0;margin-bottom:5px\"><img loading=\"lazy\" decoding=\"async\" alt=\"linkedin\" title=\"Share on Linkedin\" class=\"synved-share-image synved-social-image synved-social-image-share\" width=\"48\" height=\"48\" style=\"display: inline;width:48px;height:48px;margin: 0;padding: 0;border: none;box-shadow: none\" src=\"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-content\/plugins\/social-media-feather\/synved-social\/addons\/extra-icons\/image\/social\/balloon\/96x96\/linkedin.png\" \/><\/a>","protected":false},"excerpt":{"rendered":"<p>Kansallisarkistossa j\u00e4rjestettiin 26.6.2019 k\u00e4sinkirjoitetun tekstin koneluentaan keskittynyt Reading and Enrichment of Archival Documents (READ) -hankkeen p\u00e4\u00e4t\u00f6sseminaari. Hanke on Euroopan Unionin rahoittama (Horizon 2020) konsortio ja se on ollut k\u00e4ynniss\u00e4 tammikuusta 2016 ja p\u00e4\u00e4ttyy nyt kes\u00e4kuun lopussa. Hanketta on johdettu Innsbruckin yliopistosta. Suomesta hankkeessa on ollut mukana Kansallisarkisto. Seminaarissa esiteltiin aamup\u00e4iv\u00e4ll\u00e4 hankkeessa kehitetty\u00e4 Transkribus-sovellusta, josta my\u00f6hemmin [&hellip;]<\/p>\n","protected":false},"author":1036,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[69,388],"tags":[962,956,950,953,959],"class_list":{"0":"post-4001","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-ajankohtaista","7":"category-tutkimusaineistot","8":"tag-digitaalinen-humanismi","9":"tag-koneluenta","10":"tag-read","11":"tag-transkribus","12":"tag-tuomiokirjat","13":"czr-hentry"},"_links":{"self":[{"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/posts\/4001","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/users\/1036"}],"replies":[{"embeddable":true,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/comments?post=4001"}],"version-history":[{"count":2,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/posts\/4001\/revisions"}],"predecessor-version":[{"id":4013,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/posts\/4001\/revisions\/4013"}],"wp:attachment":[{"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/media?parent=4001"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/categories?post=4001"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogit.utu.fi\/suomenhistoria\/wp-json\/wp\/v2\/tags?post=4001"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}