Skip to content

Koneen kanssa kilpasilla – ennustaako tekoäly vai ihminen tarkemmin jääkiekon SM-liigan voittajan

Data, edistyneet algoritmit ja tekoäly ovat viime vuosina myllänneet uusiksi urheiluvedonlyöntiä. Ollaanko jo tilanteessa, jossa tekoäly päihittää ihmisen, vai onko ihmisellä vielä puolellaan valttikortteja? Huhtikuussa selviää, kuinka hyvin Digian toteuttama tekoälyennuste jääkiekon SM-liigan kärkisijoista toteutuu – vai osuvatko ihmisten ennusteet paremmin oikeaan.

 

Urheilu on arvaamatonta ja ihminen erehtyväinen, mutta voiko konekin joskus haksahtaa harhaan?

Viime vuosina uudet teknologiat, erityisesti tekoäly, ovat vaikuttaneet urheiluvedonlyöntiin. Ne hyödyntävät datan ja kehittyneiden algoritmien laskentatehoa tarjotakseen tarkempia ennusteita ja parantaakseen viime kädessä urheiluvedonlyöjien menestysmahdollisuuksia.

Mutta kuinka tarkkoihin ennusteisiin tekoäly voi yltää? Digian analyytikot päättivät testata: he rakensivat tekoälymallinnuksen, joka ennustaa jääkiekon liigakauden 2023–24 runkosarjan voittajaa, finaalipeleihin selviytyjiä sekä finaalin voittajaa. Vertailun vuoksi voittajaveikkaus kerättiin myös 300 digialaiselta.

Malli on rakennettu pieteetillä, ja mahdollisia vaikuttavia tekijöitä on otettu huomioon satoja. (Lue tarkemmin ennusteen toteutuksesta täältä.) Onko ennuste siis ylivertainen? Ei välttämättä ihan niinkään.

 

Ylivertainen laskentateho auttaa tunnistamaan kuvioita ja poikkeamia

Koneella on ihmiseen nähden puolellaan joitain etuja, kuten vaikkapa lähes rajaton laskentateho.

”Koneoppimismalleja voidaan harjoittaa valtavalla määrällä historiallista pelidataa. Koneoppiminen pystyy ottamaan kerralla huomioon huomattavasti suurempia määriä tekijöitä sekä niiden välisiä suhteita kuin ihminen”, Lead Data Scientist Teemu Salmela Digialta kertoo.

Koneen laskentateho mahdollistaa esimerkiksi erilaisten kuvioiden tai poikkeamien tunnistamisen, kun taas ihmiseltä hyvin hienovaraiset kuviot saattavat jäädä huomaamatta toistuvuudesta huolimatta. Jotkut pelaajat saattavat suoriutua paremmin tiettyjä joukkueita vastaan tai tietyissä olosuhteissa, kuten kotipeleissä tai taukojen jälkeen. Valmentajat saattavat käyttää toistuvasti tiettyjä strategioita samanlaisissa tilanteissa.

Poikkeamien tunnistamisessa taas on kyse siitä, että koneoppiminen voi auttaa tunnistamaan vaikkapa otteluiden manipuloinnin tai epätavalliset vedonlyöntikuviot, jotka saattavat viitata petolliseen toimintaan.

”Ruotsissa tuli juuri esiin sopupelitapaus, jossa haluttiin päätyä tulokseen 8–2, koska pelaajien hyvin tuntema fani lyö vetoa aina kyseisen tuloksen puolesta”, Salmela havainnollistaa.


Koneellakin on kompastuskivensä 

Koneoppimisen kompastuskivet liittyvät dataan, jolla malli on opetettu. 

”Yksi tyypillinen haaste on niin kutsuttu ylisovittaminen. Se tarkoittaa, että jos malleja ei kouluteta tai validoida asianmukaisesti, ne voivat sovittaa antamansa vastaukset liian tiiviisti historialliseen dataan, eivätkä pysty yleistämään antamaansa ratkaisua uuteen dataan”, Salmela kertoo.

Tällöin algoritmi toimii opetusdatalla hyvin, mutta muulla datalla huonosti.

Urheilun dynaaminen luonne ei ainakaan pienennä tätä riskiä. Urheilu on ennakoimatonta, ja loukkaantumiset, pelikiellot, uudet joukkuestrategiat tai muut ennalta arvaamattomat tapahtumat voivat merkittävästi muuttaa pelin lopputulosta. Koneoppimismallit voivat joskus kamppailla tällaisen arvaamattomuuden kanssa.

Ylisovittamisen ansa voidaan välttää käyttämällä tarpeeksi suurta koulutusdatan määrää.

”Olennaista on myös valita oikea algoritmi oikeaan tehtävään. Satunnainen metsä -malli, joka Digian ennusteeseen nyt valittiin, luo datan arvojen pohjalta useita päätöspuita, joiden lopputuloksista lasketaan keskiarvo. Malli itsessään siis vähentää ylisovittamisen vaaraa verrattuna esimerkiksi yksittäisiin päätöspuihin”, Salmela kertoo.

Myös datan laatu voi asettaa haasteita. Jos data on asenteellista tai ei-edustavaa, ennusteet ovat todennäköisesti virheellisiä. Tällainen tilanne syntyisi, jos kerätään dataa vaikkapa vain omilta suosikkijoukkueilta tai vain pääkaupunkiseudulta, tai dataa huomioitaisiin viime vuodelta ilman, että joukkueiden pelaajatietoja päivitettäisiin, Salmela antaa esimerkin.

Olennaista onkin jakaa data opetusdataan ja testidataan, jolla voidaan koulutusvaiheessa arvioida mallin tarkkuutta. 

Koneoppimisen käyttöön urheiluvedonlyönnissä voi liittyä myös eettisiä huolenaiheita.

”Onko tekoälyn käyttö lopputuloksen ennustamisessa reilua? Antaako se mahdollisuuden väärinkäytöksiin – erityisesti, jos sisäpiiritietoa käytetään ennusteiden muuttamiseen tai parantamiseen? Tekoälyn käytölle urheiluvedonlyönnissä, kuten tekoälyn käytölle ylipäätään, tarvitaan eettistä ohjeistusta sekä aihealueesta riippuen jopa lainsäädännöllistä sääntelyä”, Salmela sanoo.

”Ihmisen tunnepohjaista päätöksentekoa ei tekoälyllä voi jäljentää”

Tekoälylläkin on siis puutteensa, ja on ihmisellä puolellaan joitain etujakin.

Vaikka tekoäly käsittelee numeerista dataa tehokkaammin ja osaa havaita siitä kuvioita ihmistä paremmin, ihmiset ovat yleensä vahvoilla, kun pitää tulkita datan ympärillä olevaa kontekstia.

”Ihmisillä on intuitio. Osaamme ottaa huomioon tekijöitä, jotka eivät välttämättä ole helposti kvantifioitavissa datasta. Sellaisia ovat vaikkapa joukkueen yhteishenki tai moraali, tunteet ja fiilikset, pelaajien pelisuoritukseen vaikuttavat henkilökohtaiset asiat tai muu epävirallinen, hiljainen tieto”, Salmela sanoo.

Ja kun puhutaan ihmisen päätöksenteosta, tunteiden vaikutusta ei voi ohittaa. Monille vedonlyönti ei ole vain rahan tekemisestä, vaan myös jännitystä ja viihdettä. 

”Ihmisillä on usein palava halu hyödyntää omaa osaamistaan ja havaintojaan; tavallaan halu olla ekspertti ja tietää, kun muut eivät tiedä. Oma näppituntuma, aavistus, ja tunnepohjaiset johtopäätökset ovat asioita, joita koneoppimista käyttämällä ei voi jäljentää”, Salmela sanoo.

Henkilö, joka on seurannut tiettyä urheilulajia tai joukkuetta vuosien ajan, saattaakin havaita näkökulmia, jotka koneoppimismalli ohittaa. Toisaalta tunteet voivat ohjata lyömään oman joukkueen puolesta vetoa silloinkin, kun se ei ole järkevää.

Huhtikuussa ratkeaa, kumpi ennusti tarkemmin – ihminen vai kone

Jääkiekon SM-liiga ratkeaa huhtikuussa. Silloin selviää myös, kumman veikkaus osui oikeaan: 300 digialaisen, siis ihmisten, vai tekoälyn.

Vaikka loppujen lopuksi – onko sillä väliä?

Tässä se asian pihvi taitaa olla.

Koneoppiminen tarjoaa tehokkaita työkaluja, jotka voivat merkittävästi parantaa päätöksentekoa urheiluvedonlyönnissä ja monilla muilla elämänalueilla. Se ei ole virheetön, eikä sen tarvitse ollakaan, jotta siitä voi hyötyä.

”Tekoälyn vahvuuksien ja rajoitusten ymmärtäminen on keskeistä, jotta siitä saa hyödyn irti. Usein parhaat tulokset saadaan, kun yhdistetään koneen datasta esiin kaivamat oivallukset ja ihmisen intuitio”, Salmela kiteyttää.

Katso kuka voittaa

Pääset tutustumaan tekoälyn tekemään Liigan voittajaennusteeseen täällä >

Tilaa blogikirjoitukset sähköpostiisi