Käynnissä oleva digitaalinen murros luo menneisyyden tarkastelulle valtavasti uudenlaisia mahdollisuuksia. Digitalisaatio tuo jatkuvasti uusia aineistoja tutkijan saataville sekä uusia menetelmiä, näkökulmia ja yhteistyötahoja, jotka uudistavat historiantutkimuksen rajoja. Perjantaina 13.1.2017 järjestetyn kulttuurihistorian Joulukoulun aiheena oli digitaalinen historiantutkimus. Päivän aikana kuultiin muun muassa miten tietokonepohjaiset menetelmät voivat auttaa keskiaikaisten tekstien tekijäntunnistuksessa, 1800-luvun sanomalehdistöaineiston louhimisessa ja kylmän sodan aikaisen tiedustelun verkostoanalyysissä.

Kulttuurihistorian oppiaine on mukana kahdessa Suomen Akatemian Digitaaliset ihmistieteet (DIGIHUM) -ohjelman hankkeessa vuosina 2016–2019. Professori Marjo Kaartisen johtama PROPREAU-Profiling Premodern Authors -hanke toimii yhteistyössä Turun yliopiston IT-laitoksen kanssa, ja akatemiaprofessori Hannu Salmen johtama COMHIS – Computational History and the Transformation of Public Discourse in Finland, 1640–1910 on laaja konsortio, jossa ovat kulttuurihistorian lisäksi mukana Helsingin yliopiston humanistinen tiedekunta, Suomen Kansalliskirjasto sekä Turun yliopiston IT-laitos.

reima

Tietokoneperusteisen tekijäntunnistuksen avulla voidaan jäljittää esimerkiksi Ciceron tuotantoa.

Tohtori Reima Välimäki esitteli keskiajan tekstien tekijäntunnistukseen keskittyvää PROPREU-hanketta. Antiikin ja keskiajan käsikirjoitusten ajoittaminen ja tekijöiden identifioiminen on yksi keskeinen tutkimuksellinen haaste, johon digitaaliset menetelmät tuovat uudenlaisia ratkaisumahdollisuuksia. Välimäen mukaan vuosisatoja vanhoihin latinankielisiin käsikirjoituksiin sovellettu digitaalinen analyysimenetelmä on sama, jota käytetään nykyaikaisessa rikosteknisessä tutkinnassa. Tietokoneperusteisen tekijätunnistuksen avulla on mahdollista profiloida entistä tarkemmin tekstin kirjoittaja vertaamalla sitä laajaan verrokkiaineistoon niin että koneellisesti analysoidaan käytettyjä sanoja ja tyylillisiä keinoja. Näin saadaan myös lisää tietoa siitä, missä ajassa ja paikassa tekstit ovat syntyneet ja miten ne verkostoituvat ja keskustelevat toistensa kanssa.

comhis

COMHIS-hankkeessa luetaan koneellisesti vanhaa fraktuuraa.

Tutkijat Heli Rantala ja Asko Nivala esittelivät COMHIS-hanketta, joka tarkastelee suomalaisen kirjallisen julkisuuden rakentumista 1640-luvulta 1910-luvulle. Turun kulttuurihistoriassa suoritettavan osahankkeen aineistona on Suomen Kansalliskirjaston Historiallinen sanomalehtikirjasto ja se tutkii tekstilouhinnan keinoin tekstien leviämistä ja uudelleenkäyttöä yli kielirajojen suurten poliittisten ja kulttuuristen murrosten aikana aina Ruotsin vallan ajasta autonomian aikakauteen. Kulttuurihistorian tutkijat kehittävät yhdessä Turun yliopiston IT-laitoksen kanssa uusia työkaluja tekstintunnistuksen, tekstilouhinnan ja tekstien uudelleenkäytön tutkimukseen. Koska Suomessa lehdistö on ollut kaksikielistä ja uutiset levisivät yli kielirajojen suomeksi ja ruotsiksi, tekee COMHIS uraauurtavaa kehitystyötä monikielisen aineiston tutkimiseksi digitaalisten työkalujen avulla.

joulukoulu_asko

Asko Nivala esitteli myös 3-vuotista TIAS-hankettaan Romantic Cartographies.

Viime vuosina digitoitujen historiallisten dokumenttien ja lähdeaineistojen määrä on kasvanut valtavasti.  Väitöskirjatutkijat Otto Latva ja Noora Kallioniemi esittelivät jo olemassa olevia tietokantoja, joita historiantutkija voi hyödyntää tutkimuksessa. Suuret digitoidut aineistot tuottavat metodisia ja teoreettisia haasteita perinteiselle historiantutkimukselle. Siinä missä yksittäisen tutkijan on mahdotonta käydä läpi valtavaa aineistomassaa, digitaaliset työkalut soveltuvat suurten aineistojen hallintaan ja analyysiin. Lähiluvun (close reading) sijaan tietokonepohjaiset menetelmät perustuvat suurten aineistojen määrälliseen eli kvantitatiiviseen analyysiin ja etälukuun (distant reading). Joulukoulussa käsiteltyjä menetelmiä ovat esimerkiksi tekstilouhinta (Text Mining) ja tekstien uudelleenkäytön tutkimus (Text Reuse Detection), nimentunnistus (Named Entity Recognition, NER) ja verkostoanalyysi (Network Analysis).

Päivän aikana keskusteltiin laajasti digitaalisen historiantutkimuksen haasteista. Suuret aineistomassat ja tekniset puutteet kuten tekstintunnistuksen eli OCR:n (Optical Character Recognition) vaihteleva taso asettavat tutkijoille omat ongelmansa käytännön työssä. Lisäksi uudenlaiset työskentelytavat luovat teoreettisia ja metodologisia haasteita perinteiselle historiantutkimukselle. Tutkija Harri Kiiskinen korosti sitä, miten historiantutkijan on paitsi tunnettava käyttämänsä informaatiotieteen menetelmät ja työkalut, myös kyettävä tekemään tutkimusprosessinsa läpinäkyväksi. Kiiskisen oma väitöskirja on hyvä esimerkki siitä, miten voidaan hyödyntää olemassa olevia tietokantoja kulttuurihistoriallisten tutkimusongelmien ratkaisemiseen, miten datasta, algoritmeista ja klustereista päästään käsiksi menneisyyden käytänteisiin, käsitteisiin ja merkityksiin.

Turun yliopiston Filosofian, poliittisen historian ja valtio-opin laitoksella sekä Åbo Akademin saksan laitoksella toimiva dosentti Kimmo Elo esitteli kiinnostavan ja havainnollisen esimerkin siitä, miten tietokonepohjainen verkostoanalyysi paljastaa eri toimijoiden välisiä piileviä suhteita ja merkityksiä DDR:n tiedusteluraporteissa 1970-ja 80-luvuilla. Elo on myös toimittanut Turun Historiallisen Yhdistyksen julkaiseman kirjan Digitaalinen humanismi ja historiatieteet (2016), joka on tuore katsaus digitaalisiin ilmiöihin, työskentelytapoihin ja tutkimusmenetelmiin historiantutkimuksen saralla.

Digitaalisen historiantutkimuksen nykytilaa, historiaa ja tulevaisuutta pohdittiin päivän viimeisissä puheenvuoroissa. Dosentti Petri Pajun puheenvuorossa nousivat esiin digitaalisen historiantutkimuksen pitkäaikaiset verkostot ja yhteistyö eri yliopistojen välillä. Tätä digitaalisen historiantutkimuksen verkostoa kartoittaa Koneen Säätiön rahoittama hanke Towards Roadmap for Digital History in Finland: Mapping the Past, Present & Future Developments of Digital Historical Scholarship, joka jatkuu edelleen vuoden 2017 aikana.

joulukoulu_hannu

Hannu Salmi esittelee miten uutinen Paganinin kuolemasta levisi viraalisesti yli maapallon vuonna 1835.

Digitalisaatio on globaali ilmiö, mutta sitä on toteutettu pääosin kansallisella tasolla eri instituutioissa ja muistiorganisaatioissa.  Seuraavana tavoitteena on yhdistää olemassa olevia aineistoja yhä useamman tutkijan saataville. Akatemiaprofessori Hannu Salmi esitteli alkamassa olevaa hanketta, joka tuo yhteen eri mantereilla olevia kokoelmia, tutkijoita ja asiantuntemusta Yhdysvalloista ja Australiasta saakka. Oceanic Exchanges -hanke tutkii tekstuaalisia ja visuaalisia samuuksia globaalilla tasolla tarkastelemalla tekstien vaellusta valtamerten taakse yli kieli- ja kansallisuusrajojen. Globaalit aineistot ja tutkimusmenetelmät mahdollistavat myös uuden mittakaavan tutkimusongelmat kulttuurihistorialliselle tutkimukselle.

Kirjoittaja on tohtorikoulutettava kulttuurihistorian oppiaineessa.