Tekoälyalan kehitys- ja julkaisutahti on ollut kova ja kiihtyvä vuonna 2023. Messujen aikana Amazon julkaisi Anthropic kauppansa, ChatGPT multimodaalisuutensa (teksti, kuva, video, koodi…) ja Spotify podcasterin äänen kloonauksen käännöksiä varten. Esimerkiksi TopAI.tools-nettisivu listaa yli 4800 AI-työkalua (luettu 27.9.2023).
AI & Big Data Expossa Amsterdamissa 26.-27.9.2023 piipahtivat paikalla 3AMKin tekoälytiimistä Mika Hämäläinen (Metropolia), Janne Kauttonen (Haaga-Helia) ja Asko Mononen (Laurea). Alla heidän päällimmäisiä ajatuksia ja havaintoja listattuna, enempiä editoimatta ja ”finglish”-kielellä. 😊
Mitä jäi mieleen?
Odotetusti generatiivinen AI (erityisesti LLM) ja AI:n eettiset haasteet olivat isosti läsnä. Eettisiä haasteita pohdittiin useammassa paneelissa, sekä esityksissä (esim. GMS Management Solutions, de Volskbank ja TNO). Erityisesti GMS Management Solutions esitteli oman AI frameworkinsa, jossa AI mallin kehitys (esim. yrityksessä) pitäisi tapahtua kuuden kohdan kautta: Riskienhallinta (kaikkien potentiaalisten riskien arviointi), hallinto (päätöksenteko ja raportointi, mukana korkeinta johtoa), AI strategia (edetäänkö hitaasti vai nopeasti, mikä on riskinsietotaso), sisäiset käytännöt ja säännöt (yhdenmukaiset säännöt mallien kehityksessä), roolit ja vastuualueet (kuka tekee mitä ja kuka on vastuussa), sekä AI kouluttautuminen (taitojen päivitys ja ylläpito organisaation tasolla). Loppukaneettina mainittiin, että AI on kuin raketti; voimakas ja voi viedä kauas, mutta vaikea hallita. GAIn painotti omassa esityksessään sitä, että erityisesti yritysten johtajien tietotasoa AI:n toiminnasta on tarpeen lisätä sitä mukaa kun AI:n käyttö yleistyy.
Lisäksi keskityttiin paljon MLOps, DATAOps ja uutena LLMOps juttuihin, eli miten voidaan hallita helposti AI tuotteiden kehitystä, tuotantoon saattamista ja elinkaarta. Monet yritykset tarjoavat integraatiopalveluita, joilla jatkuvasti kasvava määrä erilaisia data-alustoja ja (AI) järjestelmiä (ks. esim. The 2023 MAD landscape) saadaan toimimaan yhdessä siten, että heidän tuotteensa toimii välittäjänä. Erityisesti LLMOps tukee myös ei-strukturoidun ja semi-strukturoidun datan hyödyntämistä osana liiketoimintaa (chatkeskustelut, multimediasisältö jne.). Vektoritietokannat, joihin ei-strukturoitu data voidaan varastoida, tulee keskeiseksi osaksi yrityksen ML-arkkitehtuuria. Myös syötesuunnittelun merkitys on iso kielimalleja hyödynnettäessä.
Esimerkkejä AI:n business caseista (Allegory Capital):
- täsmämarkkinointi: sisällön räätälöinti kohderyhmäkohtaisesti
- säädösten ja lakitekstien avustaja: botti käy läpi isoja määriä säädöksiä ja soppareita ja tuottaa niistä yhteenvedot nopeasti
- emootiotunnistus myynnissä: reaaliaikainen avustaja tuotteiden markkinointiin erityisesti “objection handling” tilanteisiin (Novartis)
- mielenterveyden tukeminen: AI tunnistaa työntekijöitä, jotka ovat vaarassa saada burn-outin (Incyte)
Esimerkkejä generatiivisen AI:n sovelluksista osana sovelluksia (Outsystems):
- Sisällön luominen: automaattiset vastaukset asiakkaille, käännökset, personoitu sisältö
- Sisällön yhteenvedot: keskusteluiden pääkohdat, laki ja säännöstekstien keskeiset asiat, vakuutusehtojen vertailu
- Semanttinen haku: tuotetietojen haku ja vertailu, hakupalvelut (ei enää Googlausta), automaattinen data-analyysi
- Prosessiautomaatio: Huijausten ja anomalioiden tunnistaminen, kuluraporttien laadinta
ING Bank nosti esiin AI-mallien validoinnin merkityksen. AI-malleja ei tule vain ottaa käyttöön ja olettaa, että ne toimivat hamaan tappiin asti. Mallien toimivuutta täytyy testata aika ajoin, sillä ympäröivä maailma muuttuu, joten AI-mallien on muututtava maailman mukana. ING Bankilla on erilaisia käytänteitä eri mallien validoinnin suhteen – osaa AI-malleista testataan useammin, osaa harvemmin. He kertoivat miten heidän AI riskienhallintaryhmänsä arvioi AI mallien toiminnan siten, että se täyttää tarvittavat tekniset, eettiset, lakitekniset ja muuta vaatimukset. Hänen tiiminsä tekee AI mallien validoinnin ennen kuin malli otetaan käyttöön laajemmin. Heidän tarkastus-frameworkinsa koostuu seuraavista teemoista:
- Kuka: Kuka mallia kehittää ja hallinnoi (roolit, lifecycle)
- Mitä: Mallin riskienhallinta ja tekninen toiminta (dokumentaatio, validaatio, monitorointi, kehitystyö)
- Miten: Standardit ja käytännöt (mallin validaatio, menettelytavat, viranomaismääräykset)
Itse AI mallin osalta tarkastus keskittyy yhdeksään tekijään:
- Input ja output (mitä menee sisään ja tulee ulos)
- mallin suunnittelu (design)
- dokumentaatio
- käyttökohde
- implementointi
- monitorointi
- käyttöympäristö
- säännösten noudattaminen (täyttääkö lain vaatimukset)
Lisäksi esityksessä kerrottiin hieman yllättävästi miten sääntöpohjaisen järjestelmän toiminnan arviointi voi yllättäen olla haastavaa ja he käyttävät siihen AI mallia (esim. isolation forest). Eli sääntöpohjaisesta mallista opetetaan AI-malli, jota on helpompi arvioida kuin alkuperäistä systeemiä. Sääntöpohjaiset systeemit ovat yleisiä etenkin finanssialalla. Paras lopputulos saadaan yleensä sillä, että yhdistetään sääntöpohjainen malli AI malliin.
Muita havaintoja
- Suuret kielimallit (LLM) olivat näyttävästi esillä melkein jokaisella kojulla. LLM:iä tarjottiin ratkaisuksi moniin ongelmiin, sillä niitä voi käyttää kätevästi API-rajapintojen kautta promptaamalla. Niiden avulla voidaan myös tuottaa teksteille vektorirepresentaatioita (embeddings), mikä mahdollistaa dokumenttien älykkään vertailun.
- Booking.com:in mukaan MLOps:in rinnalle on tuotava modernimpia kehitysmenetelmiä kuten FMOps sekä LLMOps. FMOps:in FM viittaa sanoihin foundation model, jolla tarkoitetaan suurella datalla koulutettuja koneoppimismalleja, jotka voidaan hienosäätää jotain tiettyä tehtävää varten pienemmällä määrällä dataa. LLMOps:in LLM viittaa suuriin kielimalleihin, jotka ovat massiivisia malleja, joille on emergoitunut erilaisia kykyjä niiden koulutusdatasta. Molemmat menetelmät poikkeavat perinteisestä koneoppimisesta siinnä määrin, että ne on hyvä huomioida omalla Opsilla.
- Edge AI. Millaisia arkkitehtuurimalleja on sijoittaa core components ja businesss applications pilveen tai paikallisesti. Jako kolmeen: Cloud based AI, Edge AI sekä Distributed AI. Edge AI-markkina kehittyy epätasaistesti eri toimialojen välillä.
- Esillä oli älypeili (vedliot.eu), alusta, johon lisätään erilaisia tietokomponentteja ja ohjataan kädellä kameraan (ja valinta tapahtuu painamalla kädellä ilmassa, kameran syvyystunnistimella).
- Paljon erilaisia pilvipalvelujen, turvallisen tallennustilan, -tiedonsiirron tai tekoälypalveluiden tarjoajia, kuten fyysisiä IOT-laitteita (sensorit).
- Carrefourin kehitteillä olevassa digitaalisessa asiakaskokemuksessa oli paljon erilaisia jo toiminnassaolevia osia, esim. asiakassegmentointi (esim. atleettinen, ei-laktoosia, vegaani), tuotesuosittelut ja -kampanjat, reseptien suosittelu, app – jolla kaupan sisällä voi löytää tuotteita (lisätty todellisuus AR). Seuraavaksi koetetaan yhdistää end-to-end asiakaskokemus. Heillä on erilaisia innovaatiokokeiluja menossa kuten neuvovat robotit ja chatbotit, Benoit viini-sommelier, automaattiset inventoijarobotit, automaattikassat, tavaratalon kävijöiden seuranta, automaattikauppa ja jakelurobotit. Heidän ”data loop” mallissa käyttäjä käyttää sovellusta, jonka takana on businesslogiikka, josta transaktiotieto syntyy. Sieltä historiallinen data siirretään varastoon (ETL) ja sen päälle rakennetaan tekoälymalleja.
- Outsystems. Tekoälyä käytetään sekä kehittäjien apuna että tuomaan sovelluksiin uutta älyä. Koodareille on viisi tekoälymentoria: koodi-, arkkitehtuuri-, ylläpidettävyys-, performanssi- ja tietoturvamentori. Itse sovelluksiin älyä saadaan esim. sisällön luomiseen, -tiivistämiseen, semanttisiin hakuihin ja prosessiautomaatioon. Demossa näytettiin nopeutettuna, kuinka vakuutusyhtiö voi lisätä vaikka ChatGPT:n verkkokauppaan, jolloin käyttäjä voi vertailla muidenkin yhtiöiden vakuutustarjouksia (liitetiedosto) ostettavaan vakuutukseen ja saada hinnoista, vakuutusehdoista ja niiden kattavuudesta selkokielisen tiivistelmän. Tyyliin ”vartin homma”, eli esim. näin voi uudet kyvykkyydet valua osaksi olemassa olevia palveluja ja parantaa niitä merkittävästi. Jatkossa koodari ei siis välttämättä suoraan koodaa enää sovellusta vaan toimii ”development guidena”, kun tekoäly kirjoittaa koodin valmiiksi.
- UNICRI on yhteiskehittänyt mm. Interpolin kanssa vastuullisen tekoälyn tueksi poliisivoimille hyvän, laajan toolkitin kesällä 2023. Lisää voi lukea täältä. Sieltä löytyy myös hyvää selkokielistä perustietoa tekoälyn perusteista.
- IKEA esitteli verkkokauppansa tekoälylogiikkaa, eli erikseen tuote- ja sisältösuosituksia. Kun käyttäjä saapuu verkkosivulle, sisältökandidaatit haetaan, suodatetaan, annetaan henkilökohtainen ”score” ja näytetään prioriteettijärjestyksessä. Hommaa ”helpottaa” 3,6 miljardia verkkokäyntiä vuodessa (300+ kutsua sekunnissa).
- Datamäärän kasvaessa useissa eri lähteissä (ja Big Dataan liittyen) esiteltiin metadata connectoreita ja meta data lake – arkkitehtuuria. Eli haetaan ensin metadatasta ja vasta sitten mitä tarvitaan käyttöön. Skaalauksen näkökulmasta malli on: useat datalähteet – varastointi – prosessointi – deliver insights. Erilaiset integraatioalustat ja yleisesti ”interoperability” nousee arvokkaaseen rooliin.
- Heineken esitteli hyperautomaatiota. Polku kulkee heidän mukaansa personal/basic automation – intelligent automation – hyperautomation (automate everything, cognitive & decision automation).
Helsingissä, 9.10.2023
Asko Mononen, Laurea
Janne Kauttonen, Haaga-Helia
Mika Hämäläinen, Metropolia