Blogi

Voiko generatiivisen tekoälyn valjastaa urheilun ennustamiseen? Päätimme kokeilla – näin ennuste jääkiekon MM-kisoista 2024 toteutettiin

Kirjoittanut Teemu Salmela | Lead Data Scientist | 16.5.2024 7:49


Generatiivista tekoälyä ei ole totuttu yhdistämään ennustamiseen. Päätimme kokeilla, miten se siihen soveltuisi. Kokeilut ovat tekoälyn hyödyntämisessä tärkeässä roolissa, jotta itselle hyödyllisimmät teknologiat ja sovelluskohteet löytyvät.

Tekoälytekniikat haastavat jo urheilutulosten ennustamisessa perinteiset tahot, kuten urheiluasiantuntijat sekä veikkaustoimistot. Testasimme aiemmin tekoälyn potentiaalia ennustamisessa jääkiekon SM-liigan tulosten osalta, ja nappiinhan se meni. Nyt vuorossa on jääkiekon MM-kisat.

Tuore ennuste on toteutettu eri tekniikalla kuin aiempi Liiga-ennuste: generatiivista tekoälyä hyödyntäen.

Generatiivisen tekoälyn ratkaisut ovat tulleet suurelle yleisölle tutuksi ChatGPT:n kaltaisista palveluista, jotka perustuvat kielimalleihin ja auttavat ennen kaikkea sisällöntuotannollisissa tarpeissa. Ennustamiseen niitä ei ole tyypillisesti liitetä.

Teknologia ennusteen takana

Vuoden 2024 jääkiekon MM-kisojen voittajan ennuste on toteutettu käyttämällä RAG-pohjaista LLM-ratkaisua.

Retrieval-Augmented Generation eli RAG on kehittynyt tekoälytekniikka, jossa yhdistyy kielimallien generatiiviset kyvyt ja edistyneet tiedonhakutekniikat tiedon löytämiseen. RAG laajentaa pelkän kielimallin ymmärrystä ja antaa sille mahdollisuuden hakea ja käyttää mallin ulkopuolisia asiakirjoja tarkempien ja asiayhteyteen liittyvien vastausten tuottamiseksi.

Vuoden 2024 jääkiekon maailmanmestarin ennustamiseksi RAG-pohjainen ratkaisu toteutettiin integroimalla Llama 3 -kielimallin päälle muutamia komponentteja, kuten Ollama, ratkaisun ajamiseksi lokaalisti, ja Milvus-vektoritietokanta (hyvin skaalautuva vektoritietokanta) maajoukkuepeleihin yleisesti liittyvän tiedon säilömiseen.

Tämän asetelman avulla malliin voitaisiin poimia valtavia määriä MM-jääkiekkoon liittyviä historiallisia ja nykyisiä tietoja – niin pelaajatilastoista joukkueiden suorituksiin kuin loukkaantumisraporteista vaikka pelipäivien sääolosuhteisiin – ja käyttää näitä tietoja dataan perustuvien ennusteiden tekemiseen. Tällä kertaa tiedonkeruuvaiheen nopeuttamiseksi kokosimme pelkästään tietoja aiempien otteluiden lopputuloksista.

RAG-mallin yksi tärkeä hyvä puoli on, että uutta asiaa pystytään tuomaan joustavasti mallin päälle, eikä tarvitse odottaa, että kielimallista tulee seuraava versionumero. Jäämme siis jännityksellä seuraamaan, milloin tekoäly saa oikeasta kuviosta kiinni, kun ennustetta päivitetään kisojen aikana noin parin arkipäivän välein.

Miten koko komeus tehtiin?

Toteutukseen liittyi useita vaiheita:

  1. Infrastruktuurin perustaminen  

    Ensimmäinen vaihe sisältää RAG-arkkitehtuurin rakentamisen Llama 3:n ja Ollaman avulla, integroituna Milvus-tietokantaan, joka helpottaa tietojen tehokasta tallentamista ja hakemista. Tällä kokoonpanolla varmistetaan, että järjestelmä pystyy käsittelemään suuria tietojoukkoja nopeasti ja tarkasti.

  2. Tietojen kerääminen  

    Tarpeeksi kattavan tietojoukon kerääminen on ratkaisevan tärkeää, jotta ennusteet olisivat luotettavia. Jääkiekossa tämä voisi tarkoittaa joukkueiden ja pelaajien historiallisten suoritustietojen lisäksi myös pelillisten tekijöiden, kuten pelipaikkojen, uusien pelityylien/kokoonpanojen ja jopa kotiyleisön tuen huomioimista sosiaalisen median tuoreeseen kommentointiin perustuen. Nämä tiedot sitten muotoillaan ja tallennetaan vektoritietokantaan. Verrattuna perinteiseen koneoppimiseen, kielimallin käyttäminen tarjoaa joustavamman tavan käyttää koulutukseen vaihtelevasti muotoiltuja datasisältöjä. 

    Tällä kertaa kokosimme ennusteen pohjaksi pelkästään tietoja aiempien otteluiden lopputuloksista. Näin saimme tiedonkeruuvaihetta nopeutettua. Lisäksi mallia testatessamme totesimme, että tämä data riittää antamaan tarpeeksi tarkkoja lopputuloksia.

  3. Mallin koulutus  

    Kun tiedot on tallennettu ja muokattu, seuraava vaihe onkin mallin kouluttaminen. Tämä tarkoittaa Llama-mallin hienosäätöä erityisillä jääkiekkotiedoilla, jotta sen ennustuskyky voidaan mukauttaa lajin omanlaiseensa vivahteikkuuteen. Tekoälymalli oppii tunnistamaan laajoista aineistoista kuvioita ja dynamiikkaa, jotka eivät välttämättä ole ilmeisiä ihmistarkkailijoille.

  4. Ennusteen suorittaminen 

    Ennusteen tekemiseksi RAG-järjestelmä hakee tarvittavat tiedot Milvus-tietokannasta samalla kun kysely käsitellään. Näillä tiedoilla lisätään Llama-mallin pohjatietämystä, jolloin se pystyy tuottamaan tarkempia ennusteita, kun se voi tällöin hyödyntää uusimpia ja kattavampia, asiayhteydelle ominaisia, tietoja ennusteen pohjana.

  5. Tulosten tulkinta ja liiketoiminnan soveltaminen  

    Viimeinen vaihe on mallin ennusteiden tulkinta. Malli ennustaa MM-kisojen lopputulokset, mutta niin jääkiekon ennustamisessa kuin liike-elämässä mallin hyödyntäjän on syytä perehtyä siihen, kuinka vahvoilla todennäköisyyksillä ja luottamustasoilla malli ennusteensa antaa. Sokeasti tekoälyyn ei pidä luottaa, mutta oikein hyödynnettynä se helpottaa ammattilaisilla tietoon perustuvien päätösten tekemistä. Tämä voi vaikuttaa niin markkinointistrategioihin kuin vedonlyöntikertoimiin tai vaikka pelaajien rekrytointikäytäntöihin.

Miten tekoäly vaikuttaa (urheilu)liiketoimintaan? 

Niin urheilualan kuin liike-elämän ammattilaisille tekoälytekniikoiden, kuten RAG-pohjaisten LLM:n, ymmärtäminen ja hyödyntäminen voi tarjota kilpailuetua. Kyky ennustaa tuloksia suuremmalla tarkkuudella voi olla urheilussa avuksi esimerkiksi:

  • Vedonlyönnissä ja pelaamisessa: Tekoäly parantaa vedonlyöntikertoimien ja peliennusteiden tarkkuutta, mikä voi houkutella lisää käyttäjiä ja lisää vetoja, siis lisätä rahallista volyymia.

  • Markkinoinnissa ja myynnissä: Tekoälyä voi hyödyntää markkinointikampanjoiden ja myynninedistämistoimien optimoinnissa todennäköisimmin menestyvien joukkueiden tai odotettujen otteluiden ympärille.

  • Joukkueen johtamisessa ja rekrytoinnissa: Pelaajakauppoja ja -varauksia voi optimoida simuloimalla pelejä eri kokoonpanoilla. 

Mitä vastaavat esimerkit olisivat muilla aloilla? Vain mielikuvitus on rajana. Tekoäly luo uusia, merkittäviä liiketoimintamahdollisuuksia eteenpäin katsoville yrityksille kaikilla toimialoilla. 

Nyt kun jännitämme jääkiekon maailmanmestaruuskilpailuja, tekoälyn hyödyntäminen ei ainoastaan lisää lajiin liittyvien nyanssien ymmärrystä vaan myös sitoutumista lajiin auttamalla löytämään yhä uusia vivahteita lajin sisältä.  

Vaikka urheilutulosten ennustamisen taustalla olevat tekniikat voi tuntua monimutkaisilta, niiden soveltaminen tarjoaa kuitenkin konkreettisia etuja liike-elämään. Tekoälytyökalujen avulla yritykset voivat saada käyttöönsä tehokkaampia ennusteita, jotka perustuvat laajaan ja kattavaan datan analysointiin.  

MM-kisahuuma kasvaa - katso ennuste lopputuloksista >

Digian tekoäly ennusti jääkiekon Suomen mestarin

Digian kehittämä tekoäly ennusti Liiga-kauden voittajaa koko kauden 2023–2024 ajan. Ennustetta seuranneille ei tullut yllätyksenä, että Tappara sinetöi mestaruuden. Lue miten ennuste onnistui ja miten se auttaa myös yrityksiä tekemään parempia päätöksiä >