maanantai 5. helmikuuta 2018

mikä on data-järvi???

Oon puuhastellut viime aikoina datan ympärillä. No data on siis tietoa jossain kummallisessa muodossa. Se voi olla aikasarja-dataa, eli vaikka mittaustietoa, tai se voi olla vaikkapa valokuvia tai dokumentteja. Eli data voi olla monenlaisessa muodossa...
Sitten tämä ihmeellinen data-järvi... Eli data säilöjä on ollut käytössä jo pitkään, mutta niihin on aina määritetty data tiettyyn muotoon, eli etukäteistä työtä vaaditaan. Nyt data-järvi on ajateltu olevan vähän toisenlainen... Eli tänne voi imaista dataa missä muodossa vaan ja vasta sen päälle tehdään pohdintaa ja päätelmiä. Ei kuulosta kovin monimutkaiselta.
No pohditaanpa vaikka case atomimummo. Eli data-järveen voisi kerätä kaiken datan mitä minusta löytyy eri sosiaalisen median kanavista. Sitten voisi päätellä että harrastan laskuvarjohyppäämistä, olen Fortumilla duunissa ja minua kiinnostaa digi-asiat, matkustaminen ja lasten kanssa puuhailu. Näiden tietojen ja minun some-käyttäytymisen perusteella minulla voisi mainostaa matkoja, digi-palveluita ja lastenvaatteita Facebookissa, Instassa ja Twitterissä tiettyyn aikaan. Digi-asiaa kannattaa mainostaa päivällä ja Twitteriin (tai Googleen), kun taas vapaa-ajan juttuja ehkä illemmalla ja Faceen. Lisäksi data-järveen voi kerätä tietoja siitä missä asun ja kuljen, jolloin minulle voi toimittaa ilmoituksen ruuhkista Kehä1:llä arkipäivinä (kuten Waze tekeekin).
Tällaisen tiedon asiakkaasta voi kerätä joko CRM-tietokantaan ja siinä esim. Salesforce on kehittänyt palveluitaan, tai tiedon voi kerätä ja käsitellä data-järvessä.

Sitten mennäänkin eri teknologioihin... Data-järveen on käytännössä vaihtoehtona muutama eri teknologia. Amazon Web Services (AWS) on suurin ja Microsoft on kakkosena, sen lisäksi on kymmeniä eri vaihtoehtoja. Mutta miten ihmeessä voi valita kun näitä on yhtä vaikeaa verrata kuin vakuutuksia... Luulen että yhtä oikeaa valintaa ei ole vaan pitää tehdä päätös ja elää sen kanssa muutaman vuoden.


Ei kommentteja:

Lähetä kommentti