Miten datan vastuullisuus näkyy sen parissa työskentelevän johtajan silmin? Huomioi ainakin nämä kuusi asiaa
Vastuullisuusdatasta puhutaan paljon, mutta oletko koskaan miettinyt datan vastuullisuutta? Yritykset siirtyvät yhä enemmän johtamaan organisaatiotansa tiedolla, mikä on toki loistava asia, mutta on tärkeää kiinnittää huomiota myös siihen, millaista tietoa hyödynnetään.
Tiivistettynä sanoisin, että vastuullinen data on läpinäkyvää, oikeellista, eheää, laadukasta ja täyttää kaikki lain vaatimukset. Vastuulliseen dataan on aina käyttöoikeus, ja datan käyttöä sekä sen seurauksia punnitaan aina eettisesti, tarkasti ja tapauskohtaisesti.
Kun puhutaan vastuullisesta dataohjatusta päätöksenteosta, tulisi kiinnittää huomiota ainakin seuraaviin asioihin.
1. Regulaatiot
Ensimmäisenä kiinnittäisin huomiota regulaatioon, joka asettaa tiukat vaatimukset erityisesti henkilöihin liittyvään dataan. Ei ole vastuullista, tai edes laillista, kerätä esimerkiksi sensitiivistä dataa markkinointitarkoituksiin. Tai tiesitkö, että sähköistä suoramarkkinointia saa tehdä B2B-päättäjille vain, mikäli viesti liittyy vastaanottajan työtehtäviin? Ja tiesitkö, että titteli ei riitä määrittämään työtehtävää?
Rajoituksia on todella paljon, joten tämän kohdan voisi tiivistää niin, että lain noudattaminen on ensimmäinen askel vastuulliseen datan hyödyntämiseen. Kaikkien datan kanssa työskentelevien henkilöiden tulisi tuntea erilaisiin datoihin ja niiden käyttöön liittyvät lainsäädännöt.
2. Oikeus dataan
Toisena nostaisin esiin oikeuden dataan. Se, että joku julkistaa datan tai myy sen tiettyä käyttöä varten ei tarkoita, että dataa olisi oikeus käyttää ihan mihin tahansa. Tässä mennään nopeasti harmaalle alueelle.
Esimerkiksi LinkedIn on käyttöehdoissaan aika tiukasti rajannut sen, mihin palvelusta saatavaa dataa voi käyttää. Toisaalta LinkedIn on myös vaihtelevalla menestyksellä taistellut oikeudessa siitä, voiko se kieltää tai estää muita toimijoita crawlaamasta LinkedInista julkisesti saatavilla olevaa dataa. Eli sopimusehdot kieltävät, mutta tuomioistuin on saattanut tulkita asiaa toisin.
Mikä tässä sitten on vastuullista, jää jokaisen itsensä punnittavaksi.
Minulle vastuullinen datan hyödyntäminen on sitä, että kunnioitamme aina kaikkien muiden toimijoiden sopimus- ja käyttöehtoja emmekä toimi niiden vastaisesti.
3. Datan vastuullinen käyttö
Kolmantena pohtisin datan vastuullista käyttöä. Vaikka laki ja tiedontuottajan sopimusehdot sallisivat, on hyvä aina punnita datan soveltuvuutta sen käyttötarkoitukseen. Jos esimerkiksi data sisältää tietoa henkilöistä, voidaan pohtia missä ja miten se kannattaa hyvän maun nimissä julkaista? On myös hyvä tulkita sopimusehtoja tarkasti, sillä vaikka sopimus oikeuttaisi datan käyttöön voi se rajata käyttömahdollisuuksia.
Esimerkiksi me myymme päättäjätietoa vain ja ainoastaan suoramarkkinoinnin järkevään kohdistamiseen postitse, sähköpostitse tai puhelimitse, ja rajaamme muut käyttötarkoitukset sopimusehtojemme ulkopuolelle. Meillä datan myyjänä on velvollisuus jatkuvasti arvioida sitä, mihin myymäämme tietoa mahdollisesti voitaisiin käyttää.
4. Laadukas ja paikkansapitävä data
Neljäntenä varmistaisin datan laadun ja oikeellisuuden. Internet on pullollaan dataa – mutta onko se ajan tasalla, saati luotettavaa? Koneoppivien mallien yleistyessä on yhä helpompaa tehdä luokitteluja esimerkiksi yrityksistä ja henkilöistä, mutta samanaikaisesti on ymmärrettävä tuotetun tiedon seuraukset.
Jos luokittelemme yrityksen Kauppalehti Menestyjäksi ja myönnämme tälle sertifikaatin, jota yritys voi käyttää omassa markkinoinnissaan, niin olemme vastuussa siitä, että luokitus on oikein ja kuvaa todellista tilannetta. Tähän luottaa paitsi asiakkaamme, myös tämän sidosryhmät ja kumppanit.
Toisaalta datan käyttöön liittyy käyttäjän oma huolellisuusvelvollisuus. Käyttäjän tulee varmistaa tiedon luotettavuus, ennen kuin antaa sen vaikuttaa omaan päätöksentekoon.
5. Datan läpinäkyvyys
Viidentenä korostaisin läpinäkyvyyttä ja omistajuutta. Kuka datan on tuottanut? Miten data on tuotettu? Jos data sisältää henkilötietoa, miten henkilöitä on informoitu ja miten he voivat tarkastella omaa dataansa? Ei ole vastuullista tuottaa tai käyttää dataa, jonka alkuperästä, saati omistajuudesta ei ole takeita. Uskon, että erityisesti tämän asian saralla tulemme näkemään paljon keskustelua tulevaisuudessa.
6. Datan ympäristövaikutukset
Viimeisimpänä muistuttaisin vielä, että datallakin on hiilijalanjälki. Tiedon säilöminen ja yhä kehittyneempien AI-mallien pyörittäminen vaatii melkoisen määrän sähköä. Suosittelen katsomaan tämän Elin Haugen puheenvuoron, jossa hän avaa digitaalisuuden hiilijalanjälkeä.
Tiesitkö, että yhden edistyneen syväoppimismallin rakentaminen, kouluttaminen ja käyttöönotto vaatii yhtä paljon energiaa kuin noin 30 norjalaista kotitaloutta vuodessa? Tai että datakeskukset ympäri maailman kuluttavat yhteensä 1 % verran sähköä maailman kokonaiskulutuksesta?
**************************************************
Kirjoittaja Sanna Holopainen toimii johtajana Business Insights -yksikössä ja työskentelee datan parissa päivittäin.