·

Ai-agenttien anatomia

Tekoälystä kirjoitetaan usein liian teknisesti ja ne ovat kaukana omasta arjesta. AI-agenteista kirjoitetaan myös työelämää mullistavina ihmeinä hyvin korkealentoisella tasolla. Silloin kirjoituksista puuttuu arjen operaatioihin liittyvä konkretia ja uskottavuus.

Tämä kirjoitus pyrkii käsittelemään AI-agenttien toiminnallisuuksia näiden kahden kirjoitustyylin väliltä ja tulkitsee AI-agentin anatomiaa enemmän liiketoiminnan ja loppukäyttäjän mahdollisuuksien näkökulmasta tulkittuna.

Lähdetään purkamaan AI-agentin rakennuspalikoita yksi pala kerrallaan auki!

Miten AI-agentin käyttöliittymä ja lyhyen aikavälin muisti toimivat yhdessä? 

Käyttöliittymä on se varsinainen AI-agentin ilmentymä loppukäyttäjälle. Se muodostaa mielikuvan siitä, miltä AI-agentti näyttää ja miten sen kanssa kommunikoidaan.

Käyttöliittymä esitetään usein chat-ikkunan muodossa. Se voi olla jotain ihan muutakin. Käyttöliittymä voi olla esimerkiksi CRM-järjestelmän lomakkeen painike, joka laittaa AI-agentin töihin lomakkeen kontekstin kautta ilman ihmisen kirjoittamaa tekstikomentoa.

Tekoäly ei oikeastaan tiedä tästä käyttöliittymästä yhtään mitään. Käyttöliittymä on ihan perinteistä koodia ja sen tehtävä on muodostaa ja välittää viesti eteenpäin kielimallille, joka kuuntelee sille saapuvia pyyntöjä.

Lyhyen aikavälin muisti luo käyttäjän ja kielimallin välille relevantin kontekstin.

Lyhyen aikavälin muisti on tärkeä lisäominaisuus, joka parantaa agentin päättelykykyä ja lyhyen aikavälin oppimista. Tämän muistin avulla loppukäyttäjän ja kielimallin välille syntyy paljon relevantimpi konteksti ja tekoäly ymmärtää sille lähetettyä sisältöä suhteessa aikaisempaan keskusteluun paremmin. 

Jos joku toinen käyttäjä alkaa käyttämään samaa agenttia, myös hänen ja kielimallin välille muodostetaan oma sessio ja uusi lyhyen aikavälin muisti. Tämän session muisti ohjaa kielimallin toimintaa reagoimaan kyseisen keskustelun kannalta älykkäämmin, vaikka kyseessä onkin sama agentin toteuttava koodi ja kielimalli.

Lyhyen aikavälin muisti on tosi tärkeässä roolissa myös silloin, kun kaksi eri AI-agenttia alkavat keskustelemaan keskenään. Myös tässä tapauksessa AI-agenttien välille syntyy sessio ja agenttien ajatustenvaihto hyödyntää keskustelun aikana syntyvää kontekstia lyhyen aikavälin muistin kautta. 

Tämä onkin hyvä osoitus siitä, että samalla AI-agentilla voi olla monta eri käyttöliittymää. Ihmiset käyttävät chat-ikkunaa ja toiset agentit keskustelevat saman agentin kanssa ohjelmallisesti ja myös ajastetusti taustalla toimivat agentit ymmärtävät oman muistinsa avulla paremmin, mistä töitä kannattaa jatkaa ja mitä he olivat tekemässä.

Agentin prosesseihin liittyvät ohjeet

Prosesseihin liittyvien ohjeiden avulla erilaisten agenttien toteutus onnistuu perinteisen ohjelmoinnin sijaan luonnollisella kielellä. Tässä on muutamia esimerkkejä, joita olen toteuttanut lähikuukausien aikana näiden ohjeiden avulla: 

  • Usean eri yrityksen dataan perustuvia ostokäyttäytymisen analyytikkoja
  • Segmentointiin erikoistuneita agentteja 
  • Verkostoituneiden agenttien asiakaspalvelun tiimin

Kaikkien näiden toteutuksien taustalla pyörii täsmälleen sama alusta ja koodi ja toteutus on määritelty ohjetiedostoihin luonnollisella kielellä. Uuden agentin alustaminen tai vanhojen jatkokoulutus onnistuu agentille linkitetyn dokumentin avulla, joka voi olla esimerkiksi helposti muokattava Google Driven tiedosto.

Ohjeissa voidaan kertoa, mitä apuja verkostosta löytyviltä muilta agenteilta voi pyytää. Näin agentit alkavat toimia tiiminä tehokkaammin ja hyödyntävät yrityksen dataa oletetulla tavalla.  

Agentille kuvataan työkalut eri järjestelmien kanssa työskentelyyn

Tiesitkö, että AI-agentti voi käyttää päättelynsä tukena yrityksen reaaliaikaista dataa ja hakea sitä tietokannoista itsenäisesti omiin tarpeisiinsa? Kielimallin päättelyn tueksi pitää vaan lisätä agentin taustatietoihin työkaluja kuvaava osuus mukaan.

Tämä osuus kuvaa rakenteellisessa muodossa seuraavat asiat:

  • Työkalun nimi 
  • Mitä työkalulla voidaan tehdä 
  • Millä parametreilla sitä voi kutsua 
  • Minkälaisessa muodossa työkalu palauttaa vastauksen 

Näiden kuvauksien perusteella edistynyt kielimalli osaakin jo itsenäisesti kutsua työkaluja tarvittavan tiedon hakemiseen tai kirjoittamiseen. Jos kielimallin päättely ei tunnu riittävän, aikaisemmin kuvatuissa prosessien ohjeissa voidaan tarkentaa ja kertoa, mitä työkaluja on hyvä käyttää missäkin vaiheessa prosessia. Tämä kaikki tapahtuu kätevästi luonnollisella kielellä kuvaten. 

Näiden taustatietojen avulla kielimalli pystyy suunnittelemaan ja päättelemään, mitä työkaluja se tarvitsee tehtävän suorittamiseen ja missä vaiheessa prosessia ja myös parametrit, joiden avulla työkalut palauttavat toivotun tuloksen takaisin. 

Työkalujen toteutukseen ja jatkokehitykseen liittyy vielä yksi tosi mielenkiintoinen pohdinta. 

Miten iso osa työkalujen logiikasta tehdä tekoälyn päättelyn ja luonnollisen kielen ohjeiden toimesta vs. miten tiukasti työkalun ohjelmointikoodilla halutaan kontrolloida tapahtumien ketjua? 

Kaikkein joustavimmissa ratkaisuissa tekoäly koodaa itse itselleen työkalujen parametrien sisällön lennossa ja pystyy sitten todella elastisesti toteuttamaan liiketoiminnan toiveita, joita agentille voidaan kouluttaa luonnollisen kielen avulla. 

Tämä on mielestäni agenttien kykyjen elastisuuden kannalta ja sitä kautta myös liiketoiminnan kannalta iso ja tärkeä kysymys.

Tekoäly osaa hyödyntää myös strukturoimatonta dataa

Jopa 80 % yrityksien datasta on strukturoimatonta dataa.

Esimerkiksi: käyttöehtoja, sopimuksia, tarjouksia, doc-, pdf-, ppt-muotoiset ohjeistukset ja esitykset, Slack-kanavan keskustelut, sähköpostit, kuvamateriaalit, videot ja paljon muutakin. Strukturoimaton data on ihan keskeistä tietoa uuden työntekijän perehdytyksessä, jotta hän pystyy toimimaan firman edellyttämällä tavalla. 

Tästä samasta syystä myös AI-agentilla tulisi olla työkalut, joilla se voi kytkeytyä strukturoimattomaan dataan. Tätä osaa AI-agenttien anatomiasta kutsutaan nimellä RAG eli Retrieval Augmented Generation. RAG-työkaluilla AI-agentti voi omatoimisesti suorittaa haun luonnollisella kielellä ja saa vastauksena yrityksen arkistosta mahdollisimman osuvat tiedot.

Tiedon hakemiseen käytetään apuna tekoälyä, jonka avulla luonnollisen kielen haku täsmätään arkistoituun aineistoon ja palautetaan sitten AI-agentille takaisin. Tämän haun lopputuloksena AI-agentti saa päättelynsä tueksi tarkkaa ja relevanttia dataa yrityksen strukturoimattomasta datasta. AI-agentti voi itsenäisesti päätellä, oliko vastaus hyvä ja tarvittaessa tarkentaa hakua omatoimisesti.

Yrityksen strukturoimattoman datan kuvaaminen, jäsentäminen ja arkistointi kielimallien hyödynnettävään muotoon on ihan keskeinen osa tekoälytoteutuksien onnistumista.

Jos 80 % yrityksen datasta on strukturoimatonta, niin jokainen yritys voi pysähtyä miettimään, miten tärkeä tehtävä tämmöisen arkiston ylläpitäminen ja parantaminen on jo nyt. Jos kelataan tästä pari vuotta eteenpäin, miten tärkeä tehtävä se on siinä vaiheessa?  

Miten AI-agentin toimintaa mitataan ja monitoroidaan?

Tämä on keskeinen kysymys, jota monet pohtivat jo ennen agentin rakentamista. 

Agentille voidaan toteuttaa työkalu, jonka avulla se itsenäisesti tallettaa päättelynsä sisältöä sovitussa muodossa talteen. Voit verrata tätä osuutta esimerkiksi Google Analyticsin toimintaan, jossa ennalta sovittuja tietoja lähetetään analysointia varten talteen.

Esimerkiksi seuraavanlaista dataa: 

aikaleima, session_id, original_prompt, tool_input, tool_output, agent_reasoning_at_this_stage 

Näin agentille syntyy pitkän jänteen muisti, joka opettaa sitä toimimaan jatkossa paremmin ja agentti voi lukea ja kirjoittaa tätä dataa aikaisemmin kuvatuilla työkaluilla itsenäisesti. 

Meille ihmisille syntyy mielenkiintoista analytiikkaa ja koulutusaineistoa, jonka avulla agentin toimintaa voidaan parantaa entisestään. Agentin kouluttaja voi seurata dataa, löytää mahdollisia ongelmia ja päivittää prosesseihin liittyviä ohjeita tilanteen korjaamiseksi.

AI-agenttien analytiikkaa liiketoiminnan tulosten kehittämiseen 

Nämä mittarit voivat olla arkipäivää jo tänä vuonna monissa yrityksissä: 

  • Asiakasta avustavan AI-agentin X konversioprosentti toteutuneeseen kauppaan + miten se muuttuu, kun agenttia koulutetaan paremmaksi.  
  • AI-agentin Y kautta toteutuva keskiostoksen koko + miten se muuttuu koulutuksen myötä. 
  • AI-agenttien X ja Y AB-testin tulokset asiakastyytyväisyytenä mitattuna 

AI-agenttien analytiikan avulla toimintaa päästään monitoroimaan ja kehittämään suoraan liiketoiminnan mittareilla ja saadaan vastauksia business case kysymyksiin.

Miten tekoälyn kanssa päästään alkuun ja seuraavalle tasolle? 

AI-agentin tekninen toteutus ja kielimallien hyödyntäminen alkaa olla jo aika triviaali osuus toteutusta.

AI-agenttien rakentamiseen on tarjolla paljon valmiita työkaluja ja kirjastoja, joiden avulla konfiguroidaan vaan työkalut ja kirjoitetaan prosessien ohjeet kuntoon. Osa kielimalleista toimii lokaalisti omassa ympäristössä ja oikein isot kielimallit ovat tarjolla maksua vastaan pilvipalveluna verkossa. 

Monissa yrityksissä pohditaankin jo saatavilla olevan datan, IT-arkkitehtuurin ja kielimallien välisiä suhteita: 

  • Miten AI-agentit toteutetaan skaalautuvaksi osaksi yrityksen IT-arkkitehtuuria ja yrityksen liiketoiminnan prosesseja? 
  • Minkälainen operointimalli yrityksessä mahdollistaa AI-agenttien adoption ja jatkokehityksen osana liiketoimintaa? 

 Nämä ovat mielestäni tosi mielenkiintoisia kysymyksiä ja keskusteluja. Toivottavasti tämä kirjoitus antaa hyviä eväitä siihen pohdintaan. 

Monissa yrityksissä on jo käynnistynyt mielenkiintoinen transformaatio, jossa AI-agenttien käyttötapaukset haastavat yrityksen strategian kautta katsottuna jo vakiintuneita prosesseja. Kova kilpailuetu syntyy siinä vaiheessa, kun tekoälyn käyttötapaukset kiihdyttävät strategian toteutumista uudelle tasolle.