Monet viimevuotiset tutkimushankkeet toteutettiin pääosin pandemia-aikana, joka takuulla yllätti sitä ennen aloitetut projektit. Tallensimme ja pohdimme yhden ylirajaisen tutkimushankkeen kokemuksia koronavuosilta.

Informationsflöden-hanke sai alkunsa syksyllä 2018, jolloin valmistelimme yhteistä suomalais-ruotsalaista tutkimusta Uumajan yliopiston tiloissa. Olimme aiemmin tutkineet sitä, miten suomalaiset sanomalehdet kopioivat toistensa tekstejä, ja nyt tarkoitus oli laajentaa tarkastelu myös ruotsalaisiin lehtiaineistoihin. Niitä voisi tietokoneavusteisesti verrata Suomessa julkaistuihin ruotsinkielisiin lehtiin ja näin selvittää, kuinka lehtitekstejä kopioitiin Ruotsista Suomeen ja toisin päin tai muuten toistettiin Itämeren molemmin puolin. Tekstien jäljentäminen toisista lehdistä eli saksijournalismi palveli jo varhain toimittajien uutishankintaa.

Rahoitusta haettiin akatemiaprofessori Hannu Salmen johdolla Svenska Litteratursällskapetilta (SLS) alkukesällä 2019, ja onnekkaasti hankerahoitus saatiin. Tutkimushanke Informationsflöden över Östersjön: Svenskspråkig press som kulturförmedlare 1771–1918 (Informaatiovirtoja Itämeren yli: ruotsinkielinen lehdistö kulttuurin välittäjänä 1771–1918) toteutettiin vuosina 2020–2023 neljän yliopiston yhteistyönä. Mukana olivat Turun yliopiston lisäksi Helsingin, Uumajan ja Örebron yliopistot.

Varsin pian hankkeen alettua, maaliskuussa 2020, maailma ja yhteistyöprojektin tilanne mutkistui koronapandemian vuoksi. Maailmanlaajuinen tartuntatauti oli pitkään ollut erittäin kaukainen ajatus. Kun hakemukseen kirjoitettiin mahdollisista riskeistä, ”Riskbedömning”, ei mieleen edes juolahtanut, että pandemia voisi iskeä. Tosin tunnistimme hakemuksessa epävarmuudeksi ruotsalaisen lehtiaineiston digitointihankkeen etenemisen (heidän kansalliskirjastossaan), ja tähän pandemia vaikutti välittömästi.

Yhtäkkiä maaliskuisen viikonlopun jälkeen kaikkien täytyi jäädä kotiin töihin tartuntariskin vuoksi ja alkuhämmennyksen jälkeen opiskella kiireen vilkkaa etäyhteyksien kuten yliopistoissa Zoomin käyttöä. Sähköpostissa ihmettelimme, kauanko poikkeustilanne kestää ja kuinka tutkimusprojektin mahtaa käydä.

Kohta ryhdyimme myös projektissa kokoontumaan Zoomissa, jossa seurasimme tilanteen edistymistä. Tutkimusasioiden ohella käsiteltiin Suomen ja Ruotsin erilaisia koronastrategioita ja ehkä arvailtiin, milloin kukin sairastuu. Tutkimusryhmämme oli aluksi pitkään onnekkaasti terveenä, mutta Ruotsin kansalliskirjastossa oli selvästi vaikeampi sairaustilanne ja tutkimuksen aineiston saanti sieltä lykkääntyi pahaenteisesti. Sitä varten kehitimme varasuunnitelmia tutkimalla Svenska dagstidningar -sivustoa, jos lehdistömateriaalin ’toinen puoli’ muuttaisi hankkeen koko perusideaa. Suomesta meillä oli Kansalliskirjaston lehtien datapaketti jo aiemmasta COMHIS-hankkeesta käyttövalmiina.

On lähes ylivoimaisen vaikeaa palauttaa mieleen korona-ajan alkuvaihetta saati silloista epävarmuutta siitä, mitä ja millä aikataululla tapahtuu tulevaisuudessa. Monien syiden takia projektissa oli tarpeen tehdä muistiinpanoja kokouksista. Suhteellisen niukkojen päätöspöytäkirjojen mukaan järjestimme vuonna 2020 projektin sisäisiä Zoom-työpajoja, joissa pidimme esitelmiä. Työpäivän mittainen etätyöpaja vei toki yhteistä pohdintaa eteenpäin, mutta osoittautui varsin raskaaksi seurata. Pian lyhensimme esitelmiä ja pidensimme keskusteluaikaa.

Yhteiset dokumentit tallennettiin verkon kautta jaettuun kansioon. Projektin kansio piti tiedostot jonkinlaisessa hallinnassa. Hankkeen edetessä kirjoitimme Google docsissa yhdessä sovittujen työnjakojen mukaan, mikä osoittautui erittäin toimivaksi. Toisin kuin yhteiskuntatieteissä emme kuitenkaan tarvinneet pandemian takia muokattuja tai uusittuja tutkimusmenetelmiä, joista eri aloilla koottiin tietoa verkkoon (Ks. esim. ”Research During the Pandemic.” The Edinburgh Centre for Data, Culture & Society. https://www.cdcs.ed.ac.uk/research-during-pandemic (haettu 30.11.2023)). 

Kun Ruotsin aineistoa lopulta saatiin vuonna 2021, tietojenkäsittelytieteen asiantuntijamme alkoi tehdä lähdemateriaalin laskennallista käsittelyä ja sen tuloksista (eli ohjelman avulla tunnistetuista tekstintoistoista) tietokantaa, jonka ensimmäinen versio julkaistiin lokakuussa 2021. Tosin sen taustalla oli tietokannan esi- tai koeversio, josta olimme saaneet alustavia ideoita tutkimuksen painopisteistä.

Edellä mainittujen toimitusviiveiden rinnalla Ruotsissa tapahtui paljon sanomalehtiaineiston suhteen. Pandemiasta huolimatta ellei myös sen takia Ruotsissa saatiin korona-aikana toteutettua laaja historiallisen sanomalehdistön digitointihanke, jonka tuottamaa aineistoa pystyimme hyödyntämään lopulta hankkeemme aikataulun kannalta viime tipassa vuonna 2023. Huomattavasti laajentunut aineisto vaati uuden prosessoinnin, ja hankkeen tietokannan toinen, uudistettu versio julkaistiin elokuussa 2023.

Informationsflöden-tutkimusryhmä

Tekstintoistoketjuista koostuvan tietokannan ensimmäisen version lanseeraus lokakuussa 2021 järjestettiin hybridi-muodossa. Tutkijaryhmämme ylhäältä vasemmalta Patrik Lundell, Hannu Salmi ja Jani Marjanen. Alempana Petri Paju ja Heli Rantala. Erik Edoff puuttuu kuvasta. Kuva Janne Rentola, SLS.

Syksystä 2021 saatoimme vihdoin käyttää avointa tietokantaamme osatutkimuksiin, joten alun perin suunniteltu tutkimus- ja kirjoitustyö eteni jälleen. Kirjoitimme yhdessä konferenssipaperin uudesta tietokannasta, josta sitten teimme julkaisun myös ruotsiksi. Jälkikäteen on helppo unohtaa, että eihän tietokanta aina toiminut odotetusti. Sen metatietojen sekä käyttötoimintojen paranteluun sujahti roimasti työaikaa useissa kohdin.

Vuosi 2021 kului vielä pääosin epävarmuudessa tapaamisten suhteen, joten osa hankkeen tutkijoista osallistui esitelmällä kokonaan etänä järjestettyyn konferenssiin. Pandemian alkuhämmennyksessä tapahtumia peruttiin tai siirrettiin, mutta melko pian etäosallistuminen konferensseihin vakiintui osaksi tiedeyhteisöjen toimintaa. Koska opetus oli siirtynyt enimmäkseen verkossa pidettäväksi, materiaalia tekstintoistoista hyödynnettiin esimerkkeinä kurssilla, joka käsitteli digitoituja sanoma- ja aikakauslehtiaineistoja historiantutkimuksen lähteinä. 

Oikeastaan vasta keväästä 2022 lähtien maailma avautui enemmän. Pääsimme konferensseihin tapaamaan kollegoita ja saamaan palautetta, ensin Uppsalassa keväällä 2022 (Digital Humanities in the Nordic and Baltic Countries) ja sitten pohjoismaiseen historiantutkijoiden tapaamiseen Göteborgissa elokuussa 2022.

Tietokanta ja kirjan kirjoittaminen yhdistävät

Alkuperäistä julkaisusuunnitelmaa muokattiin vuosina 2020–2021 ja päätettiin keskittyä kirjan kirjoittamiseen. Kirjahanke aloitettiin pyrkimällä tuottamaan tekstiä takarajoihin mennessä. Määräajat lipsuivat, mutta korvattiin samantien uusilla. Kesän lopulla 2022 projekti kokoontui Turussa lähitapaamiseen pariksi päiväksi. Se jäi projektin intensiivisimmän työskentelyajan ainoaksi lajissaan.

Hankkeen tietokannan avulla voi kirjoittaa kirjan tai vaikka valmistautua joulun viettoon. Lähde: https://textreuse.sls.fi/

SLS huolehti suurelta osin tutkimuksesta tiedottamisesta. Nina Edgren-Henrichson esimerkiksi haastatteli hankkeen tutkijoita SLS:n tutkijablogiin. Viimeisimpänä ajankohtaisista tutkimusteemoistaan projektissa kertoi Erik Edoff Uumajan yliopistosta (ks. https://www.sls.fi/sv/blogg/vad-hade-sverige-och-finland-gemensamt-efter-1809).

Verkossa työskennellen kirjan osat pitenivät vähitellen, kunnes päästiin kirjan viimeistelyvaiheeseen keväällä 2023. Alusta asti lukujen käsikirjoituksia kommentoitiin ja ruodittiin totta kai Zoom-tapaamisissa, mikä tasan jaettuine kommentointivastuineen oli varsin tehokas keino saada ja antaa palautetta. Huomioita merkittiin ja lisäyksiä kirjoitettiin suoraan Google docsin dokumentteihin.

Lopulta yhteistyössä oli paljon tuttua ja sitä edisti varmaan osaltaan työskentely hyvin konkreettisesti jaetun, yhteisen historian eli ylirajaisen lehtiaineiston tekstintoistojen parissa. Tilannetta helpotti, että ainakin tällaisen digitaalisen historiantutkimuksen hankkeen tapauksessa tarvittavat digitaaliset työkalut ja aineistot (pl. ruotsalainen tutkimusaineisto) olivat jo olemassa koronan iskiessä täydellä voimalla, ja loppujen etätyön niksien oppiminen vain kesti jonkin aikaa. Toki ilman pandemiaa olisimme varmaan jatkaneet suunnitellusti eli pitäneet workshopit lähitapaamisina, vaikka niitä olisi ollut harvemmin (ja kustannukset olisivat vastaavasti kasvaneet). Toisaalta on myös mahdoton tietää, millaisia tuloksia lähitapaamiset olisivat tuoneet tullessaan, vuorovaikutuksellisuus kun on useimmiten toisenlaista verkossa kuin kasvokkain tavattaessa.

Vertaisarvioinnin ja tyypillisen loppukirin jälkeen käsikirjoitus valmistui taittokuntoon. Otsikoksi muotoiltiin Information Flows across the Baltic Sea: Towards a Computational Approach to Media History. Hankkeen järjestyksessä toinen, perinteisempi seminaari läsnäolijoineen järjestettiin juhlistamaan hankkeen laajennetun tietokannan ja kirjan julkaisua SLS:n tiloissa Helsingissä 25. elokuuta 2023. 

Ylirajaisessa yhteistyössä nousi esiin monta hyvää käytäntöä, joita kannattaa muistaa ja jatkaa myös tulevaisuudessa. Eduksi olivat selkeät käytännöt ja pelisäännöt alusta asti, avoimet jaetut aineistot ja sopiva alusta mahdollisen yhdessä kirjoittamisen avuksi sekä useammat, lyhyetkin tapaamiset verkossa esimerkiksi tekstien luonnoksista keskusteluun. Säännölliset Zoom-tapaamiset läpi hankkeen paitsi rytmittivät (etä)työskentelyä myös vahvistivat ryhmänä toimimista.

Jälkikäteen koronapandemian aika voidaan nähdä historiantutkimuksen digitalisoitumisen jälleen uutena askeleena, jolloin pitempään tehty aineistojen digitointi verkkoon ja verkko-opetus otettiin entistä tehokkaammin käyttöön. Korona-ajan rajoitteista vapautumisen jälkeen seuraava askel on valikoida tutkimukseen -ja varmaan myös opetukseen- sopiva yhdistelmä etä- ja lähityötapoja, mistä historiantutkijoiden kannattaa yleisemminkin vaihtaa ajatuksia.

Petri Paju, Hannu Salmi ja Heli Rantala

*

Linkit:

Hankkeen Informationsflöden över Östersjön: Svenskspråkig press som kulturförmedlare 1771–1918 kirja:

Patrik Lundell, Hannu Salmi, Erik Edoff, Jani Marjanen, Petri Paju and Heli Rantala (eds.) Information Flows across the Baltic Sea: Towards a Computational Approach to Media History. Mediehistoriskt arkiv, Lund 2023. Saatavissa: http://mediehistorisktarkiv.se/bocker/information-flows-across-the-baltic-sea-towards-a-computational-approach-to-media-history/

Tietokanta Suomen ja Ruotsin sanomalehtien tekstintoistoista:

Vesanto, Aleksi, Paju, Petri, Rantala, Heli, Edoff, Erik, Lundell, Patrik, Marjanen, Jani, Salmi, Hannu: Text reuse in the Swedish-language press, 1645–1918: Database. (August 2023.) https://textreuse.sls.fi/

Lisätietoja projektin kotisivulta ja SLS:n tapahtumasivulta:

https://blogit.utu.fi/informationsfloden/

https://www.sls.fi/sv/evenemang/seminarium-informationsfloden-over-ostersjon