Big Data analytiikka

Big data ja analytiikka vuonna 2017

Big Data ja analytiikka kuuluvat tiiviisti yhteen. Lähes poikkeuksetta asiakkaamme visualisoivat ensimmäisenä dataansa perinteisistä ja ydinliiketoiminnan kannalta tärkeimmistä järjestelmistä. Kun huomataan Tableaun ja Alteryxin ketteryys rikastaa omaa dataa monin tavoin, visioidaan usein nopeasti muutamia mielenkiintoisia asioita, joiden keskinäisiä yhteyksiä halutaan nähdä ja hyödyntää.

“Ai saisin tähän myyntidataan liitettyä säätietoa ja teillä on kaikki valmiina?”

“Entäs rajapinta tuolta meidän omasta asiakastyytyväisyysjärjestelmästä?”

Erilaista dataa halutaan eri paikoista, joita ei voida lähellekään aina ennakoida. Kuitenkin datan arvo on usein korkea, vaikkei sitä ole vielä koskaan pystytty hyödyntämään. Rahanarvoisia mahdollisuuksia on paljon ja Big Datasta innostuneet saavat täydellisesti harmonisoidun dataympäristön tavoittelijat repimään pelihousujaan.

Big Data -teknologian kehittyminen

Tableau nostaa omassa “Top 10 Big Data Trends for 2017”raportissaan esille, että juuri mahdollisuus kytkeytyä erilaisiin datalähteisiin ja lukea erilaisia datamuotoja nousee merkittäväksi, kun investoidaan Big Dataa käsitteleviin ohjelmistoihin. Esimerkiksi Tableaulta löytyy optimoidut datayhteydet yleisimpiin suuria datamassoja varastoiviin järjestelmiin, kuten Googlen BigQueryyn, MemSQL:ään, Sparkkiin ja Hadooppeihin. Vaikka datamäärät kasvavat edelleen vauhdilla, niin lukuisat tietokannat ovat kehittyneet jo erittäin nopeiksi. Tämän takia datan määrä on yhä harvemmassa organisaatiossa haaste. Merkittävämmäksi tekijäksi on noussut datalähteiden määrän kasvu ja nopeasti muuttuva ympäristö. Raportti tuo esiin data laket (datajärvet) yhtenä ketteränä ratkaisuna, joita hyödynnetään nopeassa arvonluonnissa ja osana itsepalveluanalytiikkaa. Luonnollisesti tämä edistää IT:n ja liiketoiminnan entistä tiiviimpää yhteystyötä. Viimeisimpänä raportissa mainitaan metadatakatalogien tulo markkinoille, jotta tunnistetaan ja tiedetään, missä toiminnan kannalta merkityksellinen data sijaitsee. Viimeisimpänä esitellään esimerkkejä sen hyödyntämisestä. Katalogit auttavat sekä itsepalveluanalytiikan käyttäjiä että datan vartijoita.

Analytiikkaan dataa useista eri lähteistä ja eri muodossa

Yhä useammin halutaan vielä käyttää hyväksi organisaation ulkopuolisia datan tarjoajia tai myyjiä. Tällöin data on usein pilvessä ja sen muoto voi vaihdella laidasta laitaan – on data sitten sosiaalisen median (SoMe) tai teollisen internetin (IOT) tuottamaa. Alteryx on ollut erittäin pidetty ohjelmisto organisaatioissa, joissa dataa tulee useista eri lähteistä eri muodoissa. Sen ketteryys ohjelmoitavien rajapintojen (APIt) kanssa, ja erityisesti strukturoimattoman datan (logit, XML, JSON, HTML, NoSQL) muokkaaminen analyysejä tai visualisointeja varten onnistuu tehokkaasti. Tarvittaessa muokattu data voidaan kirjoittaa talteen joko raportointitietokantaan tai Hadooppiin omaksi Data Lakeksi datan loppukäyttäjiä varten. Toisin sanoen IT:n rooli kasvaa lähemmäksi liiketoimintaa sekä muuttuu raporttitehtailijasta datanjakelijaksi. Samaan aikaan loppukäyttäjät pystyvät itse tekemään löydöksiä datasta päätöksenteon tueksi (self-service analytics). Modernit itsepalvelu BI-työkalut mahdollistavat analytiikan skaalautumisen ja hyödyntämisen organisaatiossa entistä suuremmassa mittakaavassa. Parhaimmillaan moderni dataympäristö tarjoaa tiedon hyödyntäjille mahdollisuuden itse yhdistää Big Dataa eri lähteistä sekä tehdä siitä monitasoisia analyysejä ja visualisointeja.

Tableau ja Alteryx suoriutuvat myös erittäin hyvin yksittäisten isojen datamassojen käsittelystä. Voit katsoa seuraavasta videosta, kuinka Solutiven Tapani taklaa 1,1 miljardia riviä New Yorkin taxi-dataa ja tekee datasta hyödyllisiä löydöksiä alle yhdeksässä minuutissa.

Miltä Big Datan tulevaisuus näyttää?

Big Data -luennoitsija Van Rijmenam kiteyttää muutaman mielenkiintoisen asian trendeistä osuvasti. Hän uskoo, että erityisesti eri lähteistä yhdistetystä datasta tehtyjä löydöksiä ei hyödynnä tulevaisuudessa vain johto, vaan myös arjen todelliset päätöksentekijät. Heitä ovat esimerkiksi työntekijät asiakasrajapinnassa, myyjät ja tehdastyöntekijät. Hän mainitsee Tableaun yhtenä hyvänä työkaluna jakaa dataan perustuvia oivalluksia arjen päätöksien tueksi, joiden myötä voidaan tehostaa toimintoja, vähentää kustannuksia, parantaa työntekijöiden vaikutusmahdollisuuksia, lisätä kannattavuutta ja parantaa työtyytyväisyyttä. Toiseksi hän uskoo yhä useamman organisaation näkevän datan arvon ja hyödyntävän sitä aivan uudella tasolla, vaikka organisaation ydintoiminnot olisivatkin hyvin kaukana teknologioiden hyödyntämisestä. Eli käytännössä data tulee lähemmäksi perusliiketoimintoja. Hän jopa käyttää termiä Big-Data-as-a-Self-Service. Tällä hän tarkoittanee uusia Big Data Analytics –alustoja, kuten Alteryx, jotka mahdollistavat nopean yhteyden luonnin datalähteisiin riippumatta datan muodosta. Alteryx kykenee jalostamaan dataa haluttuun muotoon ja jakamaan sitä – ilman data scientisteja tai useiden kuukausien määrittelytöitä.

Kokeile ilmaiseksi, kuinka ohjelmistomme toimivat Big Datan kanssa
Valikko