IOT ja Big Data

Internet of Things, suomeksi esineiden internet tai teollinen internet ja big data ovat kaksi eri ilmiötä, mutta usein käytännössä esiintyvät yhdessä. Erilaisten koneiden, mittalaitteiden ja anturien keräämä data on arvokasta vain fiksusti hyödynnettynä: dataa voidaan käyttää jo tapahtuneen ymmärtämiseen, tulevaisuuden tapahtumien ennakointiin tai tehdä datasta liiketoimintaa. 

Big data ja IOT -analytiikka

Big Data, IOT ja analytiikka kuuluvat tiiviisti yhteen. Lähes poikkeuksetta asiakkaamme aloittavat analytiikkamatkansa hyödyntämällä dataa perinteisistä ja ydinliiketoiminnan kannalta tärkeimmistä järjestelmistä. Kun huomataan Tableaun ja Alteryxin ketteryys yhdistellä ja rikastaa dataa, löydetään pian uusia käyttötapauksia, jotka edellyttävät erilaisten datamassojen yhdistelyä ja analysointia. Tämä edellyttää analytiikan arkkitehtuurilta erityistä ketteryyttä, sillä tulevaisuuden tarpeita voi olla vaikea ennakoida.

Big Data ja IOT -analytiikan kehittyminen

Mahdollisuus kytkeytyä erilaisiin datalähteisiin ja lukea erilaisia datamuotoja nousee merkittäväksi, kun investoidaan Big Dataa käsitteleviin ohjelmistoihin. Tableaulta löytyy optimoidut datayhteydet yleisimpiin suuria datamassoja varastoiviin järjestelmiin, kuten Googlen BigQueryyn, MemSQL:ään, Sparkiin ja Hadooppeihin (esim. Amazon EMR Hadoop Hive). Vaikka datamäärät kasvavat edelleen vauhdilla, ovat monet tietokannat kehittyneet jo varsin suorituskykyisiksi. Tästä syystä datan määrä on yhä harvemmassa organisaatiossa haaste. Merkittävämmäksi tekijäksi on noussut datalähteiden määrän kasvu ja nopeasti muuttuva ympäristö. 

Lue lisää: “Top 10 Big Data Trends”

Data lake tiedon varastointiin

Data lake on ketterä ratkaisu, jota hyödynnetään nopeassa arvonluonnissa ja osana itsepalveluanalytiikkaa. Esimerkiksi IOT-ratkaisussa data voidaan kerätä edulliseen tallennusalustaan (esim. AWS S3), josta sitä voidaan välittömästi hyödyntää ilman että liiketoiminnan tarpeet olisi vielä tarkkaan tiedossa. Käytämme Amazon Web Servicesin (AWS) palveluita kustannustehokkaiden ja suorituskykyisten ympäristöjen rakentamiseen ja ylläpitämiseen. https://aws.amazon.com/big-data/datalakes-and-analytics/

Erityisesti yhdistelmä AWS S3 + AWS Glue + AWS Athena + Tableau on nopea, suorituskykyinen ja ketterä tapa aloittaa datan kerääminen ja nopea analysointi.

Datamassat tietysti haastavat itsepalveluanalytiikan käyttäjiä: missä toiminnan kannalta merkityksellinen data sijaitsee, mitä se merkitsee ja voiko siihen luottaa? Datakatalogit auttavat sekä itsepalveluanalytiikan käyttäjiä että datan vartijoita.

 

Dataa useista eri lähteistä ja eri muodossa

Usein halutaan hyödyntää organisaation ulkopuolisia datan tarjoajia tai myyjiä. Tällöin data on usein pilvessä ja sen muoto voi vaihdella laidasta laitaan – on data sitten sosiaalisen median (SoMe) tai teollisen internetin (IOT) tuottamaa. 

Alteryx on suosittu ohjelmisto organisaatioissa, joissa dataa tulee useista eri lähteistä eri muodoissa. Se on ketterä ohjelmoitavien rajapintojen (APIt) kanssa, ja erityisesti strukturoimattoman datan (logit, XML, JSON, HTML, NoSQL) muokkaaminen analyysejä tai visualisointeja varten onnistuu tehokkaasti. Muokattu data voidaan kirjoittaa talteen joko raportointitietokantaan tai Data Lakeen datan loppukäyttäjiä varten. 

Loppukäyttäjät pystyvät itse tekemään löydöksiä datasta päätöksenteon tueksi (self-service analytics). Modernit itsepalvelu BI-työkalut mahdollistavat analytiikan skaalautumisen ja hyödyntämisen organisaatiossa entistä suuremmassa mittakaavassa. Parhaimmillaan moderni dataympäristö tarjoaa tiedon hyödyntäjille mahdollisuuden itse yhdistää Big Dataa eri lähteistä sekä tehdä siitä monitasoisia analyysejä ja visualisointeja. Tableau ja Alteryx suoriutuvat myös erittäin hyvin yksittäisten isojen datamassojen käsittelystä.

Alteryx: "Turn your databases into Big Data Analytics powerhouses"

Ota yhteyttä