Projekti

Data-analytiikasta uutta osaamista ja liiketoimintaa

Rahoitusohjelma

Lyhenne
Data-analytiikka
Projektityyppi
Kehittämisprojekti
Vahvuusala
Sovellettu kyberturvallisuus
Toteutusaika
1.4.2018 - 31.12.2020
Yksikkö
Teknologia
Rahoitusohjelma
Euroopan aluekehitysrahasto (EAKR)
Projektin kuvaus

Nopean teknologian kehittymisen seurauksena on 'Big Data' terminä noussut vahvasti julkisuuteen. Big Data -termille ei ole tarkkaa määritelmää, mutta yleisesti suuren datamäärän (volume) lisäksi vaaditaan datan monimuotoisuus (variety) sekä datan nopea lisääntyminen (vauhti eli velocity). Big Data sellaisenaan on kuitenkin lisäarvoa tuottamaton raaka-aine, ellei sitä osata jalostaa. Usein sitä verrataan raakaöljyyn, joka toimii raaka-aineena ja jota jalostamalla tuotetaan uusia tuotteita teollisuuden käyttöön.
 
Data-analytiikka on käytännössä tiedon poimimista valtavasta datamassasta tai -virrasta ja tiedon käsittelemistä erilaisilla matemaattisilla ja tilastotieteellisillä menetelmillä. Data-analytiikan tavoitteena on muodostaa tiedosta kiinnostavaa informaatiota ja malleja. Datan keräämisen ja tallentamisen lisäksi datamassaa täytyy prosessoida, analysoida sekä visualisoida eli esittää ihmiselle havainnollisessa muodossa käytettäväksi.
 
Data-analytiikkaympäristöjen ja -työkalujen kehittymisen myötä datan hyödyntämisestä ja useiden eri data/tietolähteiden yhdistämisestä on tullut yrityksille uusi mahdollisuus liiketoiminnan kehittämisessä. Perinteisen Business Intelligencen (BI) lisäksi pitäisi pystyä tekemään ennakoivia päätöksiä data-analytiikan avulla. Yritysten tuottama data saattaa sisältää tietosuojan kannalta hyvinkin kriittistä tietoa, jonka säilytykseen, suodattamiseen ja tietoturvaan täytyy kiinnittää huomiota. Pilvipalveluihin perustuvien data-analytiikkaympäristöjen haasteena on tietoturva, -suoja ja juridiset kysymykset. Vaihtoehtona niille on yrityksen oman data-analytiikkaympäristön rakentaminen. Lisäksi EU:n tietosuoja-asetus määrittää yrityksille sanktioidut velvoitteet tiedon käsittelyyn ja suojaamiseen.
 
Tämän hankkeen sekä rinnakkaisen 'Investoinnit tietoturvalliseen data-analytiikan kehittämisympäristöön' -hankkeen taustalla olevia tarpeita ja data-analytiikan hyödyntämisen nykytilaa kartoitettiin useiden Keski-Suomen alueella toimivien yritysten kanssa käydyissä keskusteluissa. Yleisesti voidaan todeta, että yrityksillä on tietokannoissaan suuri määrä niin sanottua pimeää tietoa (dark data), jonka avulla voitaisiin tuottaa lisäarvoa ja uusia innovaatioita. Pimeä tieto on dataa, jolla on lisäarvoa, mutta jota ei ole koskaan aikaisemmin käsitelty tai ei vielä osata hyödyntää omassa liiketoiminnassa. Lisäksi yrityksillä on suuri data-analytiikan osaamisen tarve, jotta ne osaisivat jalostaa dataansa saadakseen aikaan tarvittavia liiketoimintamallien muutoksia digitalisaation aikakautena. Osaajia ei löydy myöskään vapailta työmarkkinoilta.
 
Hankkeen tarkoituksena oli rakentaa tietoturvallinen data-analytiikan kehittämisympäristö, jota hyödyntäen lisättiin dataanalytiikan osaamista sekä kehitettiin ja pilotoitiin konkreettisia pimeää dataa hyödyntäviä data-analytiikan ratkaisuja, joita omaan toimintaansa soveltamalla yritykset voivat saada aikaan uutta liiketoimintaa tai olemassa olevan liiketoiminnan kasvua ja työpaikkojen lisääntymistä. Tämä hanke ja sen em. rinnakkaishanke muodostivat kokonaisuuden, jonka osarahoittamiseen osallistui energiasektorille tai siihen läheisesti liittyville toimialoille sijoittuvia yrityksiä. Energiasektori valikoitui toimialaksi, koska energian tuotanto ja kulutus vaikuttavat tavalla tai toisella kansalaisten jokapäiväiseen elämään ja ovat siten myös potentiaalinen liiketoiminnan kehittämisen alue. Yritysten sijoittuminen samalle toimialasektorille mahdollistaa data-analytiikan ja sen hyödyntämisen tarkastelun ja kehittämisen koko arvoketjussa: Tuotanto <-> Jakelu <-> Kulutus <-> Asiakkaat.
 
Data-analytiikan yleisistä kehittämistarpeista sekä hankkeeseen osallistuvien yritysten esille tuomista konkreettisista tarpeista muodostettiin yhteensä kahdeksan (8) pilotticase-tapausta, jotka toimivat hankkeessa tehtävän kehittämistyön sisällöllisenä raaka-aineena ja niissä kehitetään uusia toimintamalleja data-analytiikan hyödyntämiseen, visualisointiin ja demonstrointiin. Projektin aikana tehtiin 20 pilotcasea, kun data-analytiikan osaaminen kasvoi hankkeen aikana. Useimpiin case-tapauksista sisältyi myös yhteisiä intressejä yritysten kesken. Lisäksi levitettiin hankkeen toimenpiteiden tuloksena kertynyttä tietoa data-analytiikan hyödyntämismahdollisuuksista alueella toimiville yrityksille ja muille organisaatioille. Data-analytiikan kehittämistyötä varten rakennettiinn tietoturvallinen dataanalytiikan kehittämisympäristö, jonka investoinnit kustannettiin em. rinnakkaishankkeella.

Hankkeella saatiin aikaan seuraavat tulokset:
 
1. Data-analytiikan työkalujen ja käytön mahdollistava integroitu tietoturvallinen kehittämisympäristö on rakennettu, pilotoitu ja otettu käyttöön.
2. Pimeän tiedon hyödyntämiseen data-analyysin avulla on löydetty uusia toimintamalleja.
3. AR/VR/MR-tekniikoiden hyödyntämiseen datan visualisoinnissa on kehitetty ja demonstroitu uusia menetelmiä.
4. Tietämys data-analytiikan hyödyntämismahdollisuuksista on lisääntynyt Keski-Suomen alueella toimivissa yrityksissä ja muissa organisaatioissa.
 
Lisätietoja: Mika Rantonen, 040 716 7269, [email protected]

Projektin tulokset

Projektissa saatiin uutta osaamista data-analytiikan osa-alueella erityisesti erilaista data-analytiikka menetelmistä. Yhteistyö yrityksistä saatiin Pilotcaseja, joita on data-analytiikan avulla ratkaistaan. Lisäksi avoimien data lähteitä on selvitelty ja niiden mahdollisuuksia rikastaa yritysten toimittamaa dataa.

Hankkeessa tehtiin kaikenkaikkiaan 20 pilotcasea:

1. Avoimen datan laatu verkkopalvelussa.
2. Avoimien datalähteiden käyttö datan rikastamisessa.
3. Aurinkoenergian reaaliaikaisen tuotannon selvittäminen ja ennustaminen käyttäen erilaisia tietolähteitä.
4. Tuulivoiman tuotannon ennustaminen.
5. Sähkönkulutuksen lämpötilariippuvuus.
6. Koko Suomen sähkönkulutuksen ennustaminen useiden eri koneoppimisen menetelmien avulla.
7. Pätötehon suurien muutoksien ennustaminen koneoppimisen/tekoälyn avulla.
8. Sähköpörssin (Nordpool) 24h ennustamista kuvaava neuromalli käyttäen useita eri avoimia datalähteitä.
9. Selvitys vesistöjen pinnankorkeustietojen avoimista rajapinnoista.
10. Kaukolämmön kulutuksen ennustaminen.
11. Jätevesialtaiden animointi ja visualisointi.
12. Kevyen liikenteen seuranta.
13. Korrelaatio nopeuksien ja valoisuuden välillä, case kehä1.
14. Valosaasteen määrän vähentäminen.
15. Ihmisten liikkeiden tunnistaminen julkisella rajatulla alueella.
16. CI/CD-ketjun datan integrointi ja visualisointi.
17. Power Break Compensation.
18. Sähkölaitteiden ottotehon mittaaminen.
19. Sähkömittaridatan katkosten luokittelu.
20. Sähkön laatu.

Hanke antoi aiheita myös seuraaville opinnäytetöille, jotka opiskelijat toteuttivat osana insinööriopintojaan:
1. Hakkari Onni: Predicting traffic incidents using open data sources
2. Korpihalkola Joni: Forecasting Nord Pool’s Day-ahead hourly spot prices in Finland
3. Mäkelä Antti: Data visualization using VR.
4. Puikkonen Miikkael: Ajoneuvon OBD- ja paikkatietodatan kerääminen ja visualisointi
5. Paajanen Tatu: Koronaviruksen vaikutus liikkumiseen ajoneuvoilla Uudellamaalla
6. Vesterinen Robert: Python-pohjaiset datan visualisointityökalut. Demo: https://youtu.be/kGnfqtOnPlg
7. Tenhunen Joona: Neuroverkon koulutus generoidulla materiaalilla (KESKEN)

Lisäksi hankkeessa tehtiin data-analytiikkaan liittyviä kokeiluja seuraavasti:
1. Turun bt-datan visualisointi 
- Demo1: Turku; Joulurauhan julistus https://youtu.be/r54gLPr-rv4 
- Demo2: Turku; arkipäivät vs viikonloput: https://youtu.be/heNpUhQwYyQ 
2. Digitan LoraWAN EndPoint asennettiin
3. Jetson Nano demon kasvojen tunnistamiseen
4. Apache Spark reaaliaikaista datan analysointia testattu
5. DeepFake demon tekeminen laskentapavelimen avulla: https://youtu.be/ZO--F4Vzd_M

Kesällä 2019 työskenteli hankkeessa kolme (3) harjoittelijaa ja kesällä 2020 neljä (4) harjoittelijaa.
Muita merkittäviä tuotoksia ja dokumentteja:
1. Laskentapalvelimen Whitepaper
2. Laskentapalvelimen benchmark data-analytiikka ja tekoäly
3. GUI laskentapalvelimelle neuroverkkojen toteuttamisen helpottamiseksi: https://youtu.be/Py1AqR-qseo

Blogikirjoitukset:
1. Keskisuomalaissa yrityksissä puutteista data-analytiikkaosaamisessa
2. Laskentatehoa tekoälyn ja data-analytiikan kehittämiseen
3. Näkyvyyden arviointi neuroverkon avulla kelikamerakuvasta

Rinnakkaishankkeessa Investoinnit tietoturvalliseen data-analytiikan kehittämisympäristöön rakennettiin Jamkin tiloissa toimivan laskentapalvelin.