Blogi

Datan tietoturvaa - Tunnista haasteet ja riskit

Kirjoittanut Teemu Salmela | Lead Data Scientist | 3.10.2022 21:00

Uudessa blogisarjassamme kerrotaan miten datan tietoturvasta tulisi huolehtia ja miksi. Miten tunnistat mahdolliset haasteet ja suojaat tärkeintä eli organisaatiosi dataa?

Datan merkitys ja arvo organisaatioille kasvaa koko ajan, ja sen myötä se on yhä arvokkaampi kohde myös rikollisille ja muille hyökkääjille. Siellä missä on arvokasta tietoa, on valitettavasti myös rikollisia, jotka haluavat hyötyä tästä tiedosta - joko taloudellisesti tai organisaation toimintaa häiritäkseen.

Tietovarkauksien riskit ovat tänä päivänä mittavia, samoin kuin niistä aiheutuvat vahingot. Eivätkä kaikki yritykset pysty toipumaan tällaisesta vahingosta, kuten Suomessakin on nähty.

Organisaatioiden onkin tärkeää huolehtia, ettei datasta tule Akilleen kantapäätä, joka altistaa organisaation vakaville turvaongelmille ja tietovarkauksille.

Datan turvaaminen vaatii erikoishuomiota

Vaikka käytettävissä on lukuisia datan suojaamiseen tarkoitettuja tekniikoita ja työkaluja, kannattaa huomioida, ettei monia data science -tekniikoita, -työkaluja ja -algoritmeja ole suunniteltu yritystason turvallisuus mielessä. Lähtökohta on voinut olla vaikkapa mahdollisuus tehdä nopeita kokeiluja ja tutkimuksia. Esimerkiksi yleisesti käytetty Hadoop suunniteltiin alun perin käytettäväksi suojatuissa ympäristöissä. Turvallisuutta ei siis aina ole huomioitu datatekniikoissa.

Haastetta kasvattaa se, että aiheen hype-arvon vuoksi uusia tekniikoita ja tuotteita suunnitellaan nopealla tahdilla. Monesti voi olla hankala varmistaa, ettei niihin jää turva-aukkoja tai muita tietoturvaongelmia. Datasovelluksia rakennettaessa on sen vuoksi huolehdittava, että kokonaisarkkitehtuuri on turvallinen.

Data tulee usein epäluotettavista lähteistä. Dataa kerätään esimerkiksi IoT-laitteista, sosiaalisesta mediasta, kuten Twitteristä, avoimista tai julkisista tietolähteistä sekä erilaisista käyttäjien syötteistä. Tämä lisää datan oikeellisuuteen ja manipulointiin liittyviä riskejä.

Monipilvi vaikeuttaa tietojen suojaamista. Pilvipalvelujen ansiosta it-palveluja voidaan hankkia helposti verkosta. Valitettavasti tästä seuraa, että suojan tarpeessa olevia pääsy- ja päätepisteitä on enemmän. Lisäksi se vaikeuttaa mahdollisten haavoittuvuuksien löytämistä auditoinneissa.

Big datan monimutkaisuus lisää haastetta. Datan hyödyntämisen suurimpia haasteita on käsiteltävän tiedon monimutkaisuus. Data voi olla jäsenneltyä tai jäsentelemätöntä. Tietojen alkuperinä voivat olla mobiililaitteet, palvelimet, sähköpostitiedostot, pilvisovellukset ja muunlaiset lähteet. Tietojen suojaaminen muuttuu sitä vaikeammaksi, mitä monimutkaisemmaksi kokonaisuus muuttuu. Datan turvaaminen vaatii siis erikoishuomiota.

”Fake data” eli väärä tieto on todellinen uhka datajärjestelmille

Yksi merkittävistä big datan tietoturvaongelmista on ”fake data” eli väärennetyn tiedon generointi. Väärää tietoa voi päätyä järjestelmiin myös vahingossa. Jos tietokantaan päätynyttä väärää dataa ei pystytä havaitsemaan, vaikka tiedot olisi muuten suojattu, voi aiheutua merkittäviä ongelmia.

”Fake data” muodostaa suuren tietoturvaongelman, koska se voi heikentää kykyä tunnistaa muita oikeita ongelmia. Yritysten tulisikin suhtautua kriittisesti dataan, jota ne käsittelevät liiketoimintaprosessien parantamiseksi. Yksi lähestymistapa on validoida tietolähteet säännöllisillä arvioinneilla ja arvioida muun muassa koneoppimismalleja erilaisilla testidatajoukoilla poikkeamien löytämiseksi.

Suojaudu työntekijöiden tekemiltä tietovarkauksilta ja -vahingoilta

Datan massiivinen kerääminen ja päivittäinen käsittely monissa yrityksissä on aiheuttanut sen, että lukuisilla työntekijöillä on hallussaan kriittistä liiketoimintatietoa. Tämä edistää tietojen demokratisoitumista, mutta on olemassa riski, että työntekijä vuotaa arkaluontoisia tietoja tahallaan tai vahingossa. Työntekijöiden tekemät tietovarkaudet ovat riski suurten yritysten lisäksi esimerkiksi teknologia-startupeissa, joille aineettomaan omaisuuteen kohdistuvat varkaudet voivat olla kohtalokkaita.

Työntekijöiden varkauksien välttämiseksi yritykset voivat käyttää laillisia käytäntöjä ja seuraamuksia (NDA-sopimukset). Verkkoja voidaan turvata virtuaalisella yksityisverkolla (VPN), ja ylläpitäjien oikeuksia voidaan hallita PAM-ratkaisuilla (Privileged Access Management). On myös mahdollista käyttää Desktop as a Service (DaaS) -palvelua, jos halutaan eliminoida paikallisiin asemiin tallennetun tiedon toiminnallisuudet.

 

Digia auttaa asiakkaitaan hyödyntämään dataa uusien toimintatapojen, palvelujen ja liiketoiminnan kehittämiseksi. Seuraavassa Datan tietoturvaa -blogissa annamme konkreettisia vinkkejä datan tietoturvan parantamiseksi. Juttu on luettavissa kokonaisuudessaan myös Analyytikko-lehden elo-syyskuun numerosta (3/2022).