Blogi

Mitä liiketoimintapäättäjän tulisi tietää analytiikka-alustasta?

Kirjoittanut Hannu Muurinen | Lead Consultant | 29.10.2018 22:00

Kun yrityksessä suunnitellaan datan hyödyntämistä, tulee äkkiä puheeksi analytiikka-alusta (ns. data platform). Mikä ihmeen alusta on kyseessä ja mitä siitä pitäisi tietää? Lyhyesti sanottuna hyvä alusta on luotettavan analytiikan tärkein edellytys.

Analytiikka-alustalla tietoa tallennetaan, jalostetaan ja hyödynnetään 

Tiedot noudetaan analytiikka-alustalle eri tietolähteistä ja tallennetaan tiedostoon tai tietokantaan.  Tietoa arkistoidaan ja jalostetaan edelleen siten, että se on jatkossa helpommin löydettävissä ja hyödynnettävissä analytiikan käyttötapauksiin. Lopullinen tavoite tällekin toiminnalle on kehittää edelleen tai tehostaa liiketoiminnan prosesseja.

 Lue myös: Liiketoiminta-alusta antaa dataa – näin käytät sitä tiedolla johtamiseen 

Analytiikka-alustan kehittäminen on jatkuvaa  

Analytiikka-alustan kehittäminen on pidemmän aikavälin prosessi, eikä yhteen tarpeeseen sovitettu täsmäratkaisu. 

Analytiikka-alusta ei tule koskaan valmiiksi, eikä liian suurta palaa kannata yrittää saada valmiiksi kerralla. Varmista alustan laajennettavuus, tuo tiedot osa-alue kerrallaan, jalosta ja hyödynnä tieto ja laajenna alustaa tarpeen mukaan.

Analytiikka-alustalla on useampia kerroksia 

Operatiivisissa tietojärjestelmissä vältetään tiedon monistamista, mutta analytiikka-alustalla tiedon monistuminen ikään kuin kuuluu asiaan. Analytiikka-alustalla tieto tyypillisesti mallinnetaan useaan eri kerrokseen, jossa jokaisella tasolla on oma tehtävänsä:  

  • Data Lake: tallennetaan, arkistoidaan ja jalostetaan sisään tulevia tietoja 
  • Tietovarastokerros: mallinnetaan tiedot yhtenäiseen ja helposti laajennettavissa olevaan rakenteeseen  
  • Hyödyntämisrajapinta: raportoinnin käyttötapauksen mukainen loppukäyttäjävalmis rajapinta ja raportit 

Tiedon kerroksellisuus lisää tilan tarvetta ja toteutustyötäkin, mutta auttaa luomaan helpommin laajennettavissa ja ylläpidettävissä olevan analytiikka-alustan.  Tieto pysyy hallinnassa, kun jalostusprosessia tukee hyvin suunniteltu ja automatisoitu integrointiprosessi.

Tiedot kannattaa säilyttää aina lähdemuodossaan, esim. tiedostoina siinä muodossa, kun ne on otettu vastaan. Tiedon jalostustavat ja käyttötapaukset tulevat kuitenkin muuttumaan ajan kuluessa. Kun päättelysäännöt, analysoitavan tiedon tietosisältö tai tarkasteltava aikajakso muuttuvat, niin silloin on hyvä, että alkuperäisessä muodossaan olevaa tietoa on tarjolla, sillä tietolähteestä ei sitä aina välttämättä ole mahdollista tai järkevää tuoda.

 

Tiedon hyödynnettävyys

Jalosta tieto siten, että se on helposti hyödynnettävässä muodossa. Hyödyntämisrajapinnassa lunastetaan lupaukset tiedon laadusta ja yhdestä totuudesta. Tieto pitäisi olla hyvin saavutettavissa, se on nimetty systemaattisesti ja siihen sisältynyt laskentalogiikka dokumentoitu.  

Esimerkiksi raportoinnin rajapinnan tulee olla siinä muodossa, että raportin toteuttajan ei tarvitse toistuvasti tehdä samoja muutoksia tai korjauksia aina uutta raporttia toteuttaessaan.

Vältä lukittautumista yhteen välineeseen 

Raportoinnin muistinvaraiset tietomallit ovat tehokkaita ja tarjoavat hyvät välineet - suorastaan oikotien - tiedon mallintamiseen ja lataukseen sekä huippukokemuksen tiedon visualisointiin: Mutta mitä sitten, kun tämä tietomalli tarjoaakin pääsyn vain välinetoimittajan omalle raportointivälineelle? Jos tiedot ovat sen lisäksi tarjolla vain raakamuodossa, niin uudet raportit tai välineet edellyttävät koko jalostusprosessin toistamista uudelleen. Logiikan monistaminen useampaan paikkaan on ylläpidollisesti huono asia.

Lukittautumista voidaan välttää toteuttamalla ratkaisu avoimemmille rajapinnoille, kuten perinteiseen relaatiotietokantaan. Relaatiotietokanta on edelleen pitänyt pintansa rakenteellisen datan käsittelyssä ja hyödyntämisessä ja sen avulla voidaan toteuttaa loppukäyttäjävalmis rajapinta, joka palvelee tietoa hyödyntäviä käyttäjiä ja erilaisia integrointitarpeita laaja-alaisesti. Tietokantarajapinta on käytettävissä käytännössä jokaisella ajateltavissa olevalla analysointi- tai visualisointivälineellä ja sen käsittelyyn sekä ylläpitoon löytyy helposti osaamista.

Yksi koko ei sovi kaikille 

Analytiikka-alusta ilman käyttäjiä on hukkainvestointi. Tunnista tyypilliset käyttötapaukset ja huolehdi siitä, että yksi käyttötapaus ei sanele koko arkkitehtuuria. Kokonaisuutta palveleva arkkitehtuuri syntyy silloin, kun suunnittelussa huomioidaan tärkeimpien käyttäjäryhmien tarpeet.

Tiedon jalostus- ja noutoprosessi voi vaihdella: Dashboardin tai valmiin raportin käyttäjä hyödyntää loppukäyttäjävalmiita mittareita hyödyntämisrajapinnasta selainpohjaisilla tai mobiilisovelluksiin perustuvilla käyttöliittymillä, kun tuotekehityksen data-analyytikko puolestaan voi hyödyntää tietoa suoraan Data Lakesta tilastollisen analysoinnin välineillä ja kehittää malleja omassa ”hiekkalaatikossaan”. Kun data-analyytikon mallinnus (esim. ennustemalli) otetaan käyttöön, niin silloin se operationalisoidaan, eli liitetään osaksi muuta analytiikka-alustan integrointiprosessia ja tulokset integroidaan hyödyntämisrajapintaan tai toiseen tietojärjestelmään.

Analytiikka-alusta vaatii hallintaa

Jotta analytiikka-alusta pysyisi kuosissaan ja sen hyödynnettävyys hyvänä, tarvitaan myös työkaluja sen hallintaan. Analytiikka-alustan pystytysprojekti voi johtaa myös organisaation master-tiedon parantamiseen tai datan laadun kehittämiseen liittyviin toimiin.

Tiedon hyödyntämisen kannalta tärkeää on levittää tietoa ja parantaa tiedon löydettävyyttä esimerkiksi Data Catalog-tyyppisen palvelun avulla. Sen avulla voidaan tuottaa automaattisesti päivittyvä kuvauskanta analytiikka-alustan sisältämästä tietosisällöstä ja tuoda eri käyttäjäryhmille suunnattua joukkoistettua tietoa analytiikka-alustan tarjoamasta datasta, sen laadusta ja luotettavuudesta.