Liiketoiminnan päätöksenteon tulisi pohjautua mahdollisimman paljon tietoon, jotta oikeita päätöksiä voidaan tehdä nykyhetkessä. Nykyhetken päätökset ohjaavat yrityksen suuntaa pitkällekin tulevaisuuteen. Miten on mahdollista pohjata päätökset tulevaisuuden skenaarioihin jo nykyhetkessä?

Lyhyt vastaus on hyödyntämällä ennakoivaa analytiikkaa, jonka perusteena ovat tilastolliset mallit ja algoritmit, jotka pohjautuvat koneoppimiseen.

Kuulostaako vaikealta ja monimutkaiselta? Mikäli vastasit kyllä, sinun kannattaa jatkaa lukemista.

Aiemmin koneoppimista ja ennakoivaa analytiikkaa pystyi toteuttamaan lähinnä vain matemaatikot, tilastovelhot ja koodarit. Projektien määrittelyt olivat vaativia, datan valmistelu hidasta ja läpimenoajat pitkiä, ja siten hyöty liiketoiminnalle – joka elää nykyhetkessä – oli pieni. Suurimpana rajoitteena ennakoivan analytiikan hyödyntämiselle oli yksinkertaisesti osaavien tekijöiden vähyys ja kalleus.

Tänä päivänä Alteryx mahdollistaa ennakoivan analytiikan ja koneoppimisen hyödyntämisen operatiivisen toiminnan ja päätöksenteon tukena välittömästi, joustavasti ja ilman teknistä erikoisosaamista. Tämä tarkoittaa, että esimerkiksi myyntijohtaja, markkinointikampanjan suunnittelija tai customer success manager voi oman työnsä ohessa luoda, muokata ja parantaa ennakoivia malleja ja tehdä parempia bisnespäätöksiä reaaliaikaiseen dataan pohjautuen.

Ennakoiva analytiikka ja koneoppiminen

Koneoppimisen perusideana on hyödyntää tietyn ilmiön historiallista dataa, jota ennakoivaa analytiikkaa varten luodut algoritmit analysoivat. Mitä enemmän ja mitä pidemmältä ajalta dataa on saatavilla, sitä tarkemmin koneoppimiseen perustuvat mallit pystyvät ennakoimaan tulevia tapahtumia. Algoritmien logiikkaa ei bisnesasiantuntijan tarvitse syvällisesti tuntea, mutta menetelmien perusteet ja tarkoitus on hyvä ymmärtää.

Jos erilaiset tilastolliset menetelmät ja niiden tarkoitus ovat päässeet unohtumaan, netistä löytyy runsaasti täysin ilmaisia resursseja omatoimiseen opiskeluun, esimerkiksi Khan Academy.

Ennakoivan analytiikan ja koneoppimisen prosessissa analysoitava data jaetaan aluksi satunnaisesti kahteen osaan, yleensä 70:30-suhteessa. Suurempaa 70 %:n otosta kutsutaan opetusdataksi ja pienempää 30 %:n otosta testidataksi. Opetusdatan tarkoituksena on opettaa malli ennakoimaan valitun selitettävän muuttujan lopputulosta. Testidatalla validoidaan, onnistuiko mallin opettaminen ja onko mallin antama ennuste riittävän tarkka.

Koska opetusdatassa käytetään jo tapahtunutta historiallista dataa ja näin ollen ennakoitavan muuttujan lopputulos on tiedossa, voidaan opetus- ja validointivaiheissa selvittää kuinka tarkasti malli ennakoi jo tapahtuneen lopputuleman. Tämä tapahtuu vertaamalla mallin antamaa ennustetta jo tiedossa olevaan lopputulemaan. Kun malli on validoitu ja jos sen tarkkuus on vaaditulla tasolla, voidaan sitä käyttää ennakoimaan saman muuttujan käyttäytymistä tulevaisuudessa. Koneoppiminen mahdollistaa uuden datan syöttämiseen mukaan malliin sitä mukaa, kun sitä datalähteissä syntyy.

Ennakoivan analytiikan menetelmät

Ennakoivan analytiikan menetelmistä suurelle yleisölle tutuimpia lienevät logistinen ja lineaarinen regressio. Molemmat menetelmät käyttävät useita selittäviä muuttujia, joilla pyritään ennakoimaan tiettyä selitettävää muuttujaa.

Logistista regressiomallia käytetään binääriluokkamuuttujan todennäköisyyksien ennakoinnissa – toisin sanoen kysymyksiä, joissa lopputulema joko kyllä tai ei. Tällaisia on esimerkiksi:

  • Lopettaako henkilö asiakassuhteen?
  • Selviääkö asiakas luottosumman takaisinmaksusta?
  • Parantaako hoitosuunnitelma potilaan?

Lineaarisella regressiomallilla taas ennakoidaan jatkuvaa muuttujaa, joka voi saada minkä tahansa lukuarvon (tietyllä välillä), kuten:

  • euromääräinen hinta
  • lämpötila
  • paino
  • pituus

Esimerkiksi, jos halutaan tutkia lopettaako tietty henkilö asiakassuhteen, voidaan selittävinä muuttujina käyttää yrityksen asiakasrekisterin dataa, kuten:

  • Demografisia tietoja esim. sukupuoli, ammatti, ikä, asuinalue
  • Sopimustietoja esim. kk-maksu, asiakassuhteen pituus, sopimuksen sitovuus
  • Tietoja sopimukseen liitetyistä palveluista esim. rahoitus, vakuutus, koulutus
  • Kannattavuuslaskelmia esim. katetuotto, myynnin suhteellinen kasvu, kustannukset
  • Asiakastutkimuksen dataa esim. tyytyväisyys, NPS

Kaikki relevantti data syötetään mallin algoritmille, joka analysoi datasta tilastollisesti merkitsevät muuttujat ja laskee todennäköisyyden sille, jatkaako asiakas asiakassuhdettaan vai ei? Kun aikaa kuluu ja asiakkaista saadaan uutta dataa, se luetaan tarvittaessa automaattisesti mukaan malliin, jolloin algoritmi oppii ja tarkentaa mallia. Tulokset saadaan eriteltyä asiakaskohtaisesti, joten datan hyödyntäminen käytännön liiketoiminnassa on helppoa.

Kirjoituksen lopusta löytyvällä videolla keskustelemme ja näytämme käytännössä, miten bisnesasiantuntija voi nopeasti ja joustavasti hyödyntää Alteryxilla asiakaspoistuman ennakoivaa analytiikkaa.

Kokeile maksutta Alteryxia ja lataa kokeiluversio tästä.

On hyvä pitää mielessä, että algoritmien toimintaa ei tarvitse ymmärtää ennakoivan analytiikan hyödyntämiseksi liiketoiminnassa. Tärkeintä on, että mallin tarkkuus on tasolla, joka tuottaa liiketoiminnan päätöksille lisäarvoa. Malli ei tietenkään saa olla ”Black Box” -tyyppinen ratkaisu, jonka toiminta on ainoastaan ulkopuolisen konsultin avattavissa. Tarvittaessa mallin toiminta on pystyttävä validoimaan luotettavasti asiaan vihkiytyneen henkilön toimesta.

Koneoppiminen ja ennakoiva analytiikka saattavat vielä tänään kuulostaa monimutkaisilta tulevaisuuden teknologioilta, ja usein niiden testaamista arkaillaan turhaan. On kuitenkin jo ennakoitavissa, että niiden käyttö tulee nopeasti arkipäiväistymään lähes kaikilla toimialoilla. Ennakoivan analytiikan harjoittelu kannattaakin aloittaa heti. Erilaisten menetelmien perusteet oppii kyllä nopeasti, ja oikeilla työkaluilla datasettien valmistelu ja mallien rakentaminen sekä hyödyntäminen liiketoiminnassa käytännössä sujuu näppärästi.

 

 

Get Free Widget