Oletko ollut hiljattain tilanteessa, jossa sinun pitäisi pystyä löytämään nopeasti miten esityksessäsi käyttämä kaava on muodostunut ja mistä se on peräisin? Onko sitä mahdollisesti muokattu matkalla ja kuka sen on tehnyt? Onko tekninen KPI läpikäynyt evoluution ja haluat olla varma, että juuri oikea versio on teknisen johtajan raporteissa? Tai onko ERP:iin tulossa järjestelmäpäivitys, jota et uskalla tehdä ennen kuin olet selvittänyt sen aiheuttamien tietokantamuutosten vaikutuksen raportointiisi, etkä ehkä halua toimitusjohtajan raporttien hajoavan siihen kun pari tietokannan kentän nimeä vaihtuu toiseen? Tyypillisesti näihin selvityksiin liittyy paljon M- ja K-alkuisia kysymyssanoja, mahdollisesti myös aakkosten loppupään kirjaimella alkavia sanoja vastauksia etsiessäsi. 

Tableaulla tehtävässä datan analysoinnissa käytämme usein datalähteitä, jotka sisältävät paljon erilaista tietoa, sensitiivistäkin, vaikka emme itse niitä suoraan hyödyntäisikään. Lisäksi samoja datalähteitä voidaan käyttää useisiin erilaisiin analyyseihin ja visualisointeihin, tai niistä voidaan yhdistelemällä jalostaa uusia datalähteitä. Datan ravintoketju raakadatasta lopulliseen esitykseen voi venyä pitkäksi ja alkuperäisen datan jäljitettävyys voi olla vaikeaa. Tableaun syksyllä julkaisema Tableau Catalog -toiminnallisuus tuo helpotusta tähän ongelmaan, nimensä mukaisesti se indeksoi Tableaussa käytetyn datan ja helpottaa datan jäljitettävyyttä läpi koko sen elinkaaren.

 

Case asiakasrekisteri

Oletetaan, että yrityksen asiakastilausrekisteriin on kertynyt vuosien saatossa iso määrä asiakkaiden henkilötietoja kuten nimiä, osoitteita, puhelinnumeroita. Rekisteriä on saatettu hyödyntää erilaisiin analyyseihin ja markkinointikampanjoihin. Osa alkuperäisistä rekisterin kentistä saattaa olla uudelleen nimettynä niin, että niistä ei pysty päättelemään datan alkuperää. Yrityksesi tietosuojavaltuutettu kolkuttelee ovellasi ja haluaa tietoja siitä, missä ja kenen nähtävillä nämä tiedot ovat.

 

Kuva1-Tableau-Catalog_External-assets

Kuva 1: Missä asiakkaan nimitietoa on käytetty?

 

Tableau Catalog auttaa tällaisessa tilanteessa jäljittämään kaikki viittaukset datalähteeseen kentän tarkkuudella, missä kyseistä dataa on käytetty ja mitä polkua pitkin data on päätynyt työkirjojen sivuille. Oikeassa reunassa näkyvän Lineage (vapaa suomennos ”sukulinja”) kertoo esimerkkimme tilaustaulun suhteen, mistä tämä tieto tulee ja missä dataa on kaiken kaikkiaan käytetty. Kyseessä on tässä tapauksessa MS SQL -kannassa majaileva tietokantataulu ja sen tietoja käytetään lopulta kahdessa eri työkirjassa. Tässä tapauksessa meitä kiinnostavaa asiakkaan nimitietoa on käytetty ainoastaan yhdellä työkirjan välilehdellä, joka löytyy suoraan klikkaamalla kentän nimeä.

Kuva2-Tableau-Catalog_Downstream-sheets

Kuva 2: Lineage näyttää datan riippuvuudet suhteessa tarkasteltavaan kohteeseen.

 

Samalla vaivalla löytyy työkirjan omistaja ja voimme myös tutkia kenellä kaikilla on oikeudet päästä kiinni kyseiseen tietoon. Tällä tavoin Tableau Catalog helpottaa tiedon jäljitettävyyttä ja vähentää aikaa vievää ja turhauttavaa reverse engineering -tarvetta.

 

Kuva3-Tableau-Catalog_permissions

Kuva 3: Löydä työkirjan omistaja ja tutki kenellä kaikilla on oikeudet päästä kiinni kyseiseen tietoon

 

Haluatko olla kuskin paikalla datasi kanssa?

Tableau Catalog on osa syksyllä julkaistua Tableau Data Management -palvelua. Ota rohkeasti yhteyttä, jos haluat tutustua tarkemmin datan hallintaan tai vaikkapa nähdä demon aiheesta.

Tämä kirjoitus on ensimmäinen osa kolmiosaisesta blogisarjastamme, jossa pureudumme datan käsittelyyn Tableaussa tietosuojan näkökulmasta. Blogisarjassamme pyrimme vastaamaan kysymyksiin: Kuka voi nähdä dataa ja missä? Miten pystymme hallita datan näkyvyyttä? sekä Miten pystymme seurata datan käyttöä?

 

Lue lisää palveluistamme: Analytiikka ja BITableau 

Get Free Widget