Datatutkija, kohta tekniikan tohtori, Tuomas Sivula taitaa niin yhtälöt, algoritmit, tilastolliset menetelmät, koodin, ja mikä tärkeintä, menetelmien merkityksen käytännössä. Tässä artikkelissa Tuomas avaa omia ajatuksiaan datatutkijan tehtävästä ja itse alasta.

Aloitin loppuvuonna 2020 Teamitillä Senior Data Scientistinä (datatutkija). Olin juuri saanut päätökseen edelliset projektini teollisuudessa ja väitöskirjani akatemiassa.

Teamitillä työtehtäväni sisältäisi yrityksen AI ja Data-analytiikan toimintojen kehittämistä ja konsultointia. Otin innolla vastaan tämän monipuolisen ja mielenkiintoisen tehtävän. Nyt muutamaa kuukautta myöhemmin voin todeta, että ennakko-odotukset työstä täyttyivät ja vastaanotto työyhteisöön on ollut erittäin lämmin.

Datatutkijan työtehtävät ovat mielenkiintoinen yhdistelmä tilastotiedettä ja tietotekniikkaa. Pidän itse siitä, että työ on erittäin soveltavaa ja monipuolista; ongelmat ovat usein rakenteellisesti yksilöllisiä eikä valmiita reseptejä niiden ratkaisemiseksi ole. Työssä pääseekin käyttämään paljon omaa luovuuttaan ongelmien lähestymisessä ja suunnittelussa. Tämä on ominaisuus, johon olen tutkimustaustaisena tekijänä mieltynyt. Voisinkin kiteyttää, että tässä työssä yhdistyy akatemiapuolen ja yksityisen puolen työn monet hyvät puolet.

Datatutkijan itsenäisemmän kehitystyön lisäksi tehtäväni Teamitillä sisältää lisäksi projektisuunnittelua, asiakasyhteistyötä ja strategista suunnittelua. Hyvä pohjatyö datavetoisen palvelukokonaisuuden tarjoomassa edesauttaa asiakasprojektien läpiviennin sujuvuutta huomattavasti ja mahdollistaa edistyksellisempien ratkaisuiden toteutuksen. Tämä osuus työtehtävästä on myös erittäin mielenkiintoista ja se toimii vastapainona teoreettisemmalle datatyöskentelylle. Kokonaiskuva työtehtävästäni on itselleni sopivan monipuolinen.

Datan hyödyntäminen yrityksen liiketoiminnassa

Datan hyödyntäminen yrityksen liiketoiminnassa ei useinkaan ole valmiiden reseptien käyttöönottamista. Datatutkijana työskentelyssä työkalut ja menetelmät voivat olla eri sovelluskohteiden ja projektien välillä samoja, mutta aihepiirit ovat usein hyvin yksilöllisiä.

”Datan hyödyntämiseen ei ole valmiita reseptejä.”

Mallinnettavan ilmiön ymmärtämisellä ja vaikutettavien mekanismien tuntemisella on oleellinen osa datavetoisen projektin onnistumisessa. Tämän vuoksi AI- ja data-analyysiprojekteissa korostuu tiiviin yhteistyön merkitys ilmiön ja käsiteltävän datan tuntevien domain-eksperttien sekä datatutkijoiden välillä.

Datatutkijana löytää itsensä usein sisäistämästä itselleen kokonaan uutta toimintaympäristöä ja ongelma-aluetta. Tämä luo mielenkiintoisen vaihtelevuuden tunteen työhön ja itse pidänkin tätä yhtenä työn mukavimmista piirteistä.

Kiinnostuneisuus monista tieteenaloista ja työympäristöistä on omiaan datatutkijan ammatissa. Työssä saa ja pitääkin olla moniosaaja mutta pitää osata myös tunnistaa kaikki se mitä projektin sovellusalasta ja ilmiöstä ei tiedä. Tietämättömyyttä ja sen tunnistamista voi tukea oikealla asenteella ja sitä voi myös opetella retrospektiivisellä tarkastelulla.

Datatutkijan täytyy olla kriittinen

Sovellettaessa erilaisia data-analytiikka- ja tekoälyratkaisuja, kriittisyys menetelmien, tulosten, ja ratkaisuiden arvioinnissa saattaa joskus jäädä hieman taka-alalle. ”Kunhan se toimii” -ajattelu on ehkä nopea ja tehokasta, mutta se saattaa kostautua pitkällä aikavälillä. Verrattuna akatemiatutkimukseen, tämä korostuu usein erityisesti yrityspuolen projekteissa. Datatutkijan työn merkitys korostuu erityisesti juuri tässä kriittisessä arvioinnissa.

”Epävarmuutta ei pääse karkuun mutta sitä voi hallita.

Esimerkkejä tärkeistä osa-alueista dataprojekteissa on mallintarkistus, -vertailu, ja epävarmuuden huomioiminen; epävarmuutta ei pääse karkuun mutta sitä voi hallita. Ymmärrys mallien ja menetelmien toiminnallisuudesta ja sovellettavuudesta on erityisen tärkeää lopputuloksen arvioinnin kannalta. Hyvän datatutkijan tulisikin osata selittää ratkaisuiden ja menetelmien merkitystä asiakkaalle helposti lähestyttävällä tavalla.

Tuomas Sivula, Senior Data Scientist

Lue myös:
Data-analytiikka — Datan hyödyntäminen liiketoiminnassa
Tekoäly on tulevaisuudessa osa arkea — Missä tekoälyä voidaan käyttää?

Tuomas Sivula

Jatka lukemista