AI-sanakirja: Tekoälytermsit selitettynä suomeksi

Tekoäly muuttaa maailmaa kovaa vauhtia — ja samalla se synnyttää jatkuvasti uusia sanoja ja lyhenteitä. Jos olet yrittänyt lukea aiheesta jotain, olet törmännyt varmasti termeihin kuten LLM, AGI tai RAG. Ne voivat tuntua hämmentäviltä ihan kaikille, myös teknologia-alan ihmisille.

Tässä on koottuna selitykset yleisimmille tekoälytermseille — ei jargonia, ei turhaa sälää.

AGI eli yleinen tekoäly

AGI tulee sanoista artificial general intelligence. Kyseessä on käsite, jolla tarkoitetaan tekoälyä, joka olisi yhtä hyvä tai parempi kuin tavallinen ihminen useimmissa tehtävissä. OpenAI:n toimitusjohtaja Sam Altman on kuvaillut AGI:ta jotakuinkin näin: se olisi kuin "keskiverto työntekijä, jonka voisit palkata". OpenAI:n oman määritelmän mukaan AGI tarkoittaa järjestelmiä, jotka suoriutuvat ihmistä paremmin useimmista taloudellisesti merkittävistä töistä. Google DeepMind taas pitää AGI:na tekoälyä, joka olisi vähintään yhtä hyvä kuin ihminen useimmissa kognitiivisissa tehtävissä.

Määritelmät siis vaihtelevat, eikä alan asiantuntijoillakaan ole täyttä yksimielisyyttä siitä, mitä AGI tarkalleen tarkoittaa.

AI-agentti

AI-agentti on työkalu, joka voi tehdä useita tehtäviä puolestasi — enemmän kuin tavallinen chatbot. Se voi esimerkiksi varata pöydän ravintolasta, kirjata kuluja tai kirjoittaa ja ylläpitää koodia. Käytännössä agentti on autonominen järjestelmä, joka voi hyödyntää useita eri tekoälyjärjestelmiä monivaiheisten tehtävien suorittamiseen.

Termillä ei ole vielä kovin tarkkaa yhteistä määritelmää, ja koko ala on edelleen kehittymässä.

API-rajapinnat

Voi ajatella API-päätepisteitä kuin ohjelmiston "piilonappuloina", joita muut ohjelmat voivat painaa. Kehittäjät käyttävät niitä rakentaakseen integraatioita eri palvelujen välille. Tekoälyagentit pystyvät yhä useammin löytämään ja käyttämään näitä rajapintoja itsenäisesti, mikä avaa mahdollisuuksia laajaan automaatioon.

Ajatusketju (chain of thought)

Joissakin tilanteissa ihminen tarvitsee kynän ja paperin selvittääkseen jonkin asian — ei riitä, että vastaus tulee suoraan mututuntumalta. Tekoälymalleissa ajatusketjumenetelmä tarkoittaa sitä, että ongelma pilkotaan pienempiin välitavoitteisiin ennen lopullista vastausta. Tämä hidastaa vastaamiseen kuluvaa aikaa, mutta parantaa lopputuloksen tarkkuutta erityisesti laskennassa ja ohjelmoinnissa.

Koodausagentit

Koodausagentti on erikoistunut versio AI-agentista, joka on suunniteltu ohjelmistokehitystä varten. Se ei vain ehdota koodia tarkasteltavaksi, vaan voi kirjoittaa, testata ja korjata koodia itsenäisesti. Se käy läpi koko koodikannan, etsii virheitä ja tekee korjauksia minimaalisella ihmisen valvonnalla. Lopputulos kannattaa silti tarkistaa itse.

Laskentateho (compute)

Compute tarkoittaa laskentakapasiteettia, jota tekoälymallit tarvitsevat toimiakseen. Termiä käytetään usein lyhentämään kuvaus laitteistosta — prosessoreista, grafiikkakorteista ja muusta infrastruktuurista, joka pyörittää tekoälyjärjestelmiä.

Syväoppiminen (deep learning)

Syväoppiminen on koneoppimisen osa-alue, jossa algoritmi rakentuu kerroksellisen keinotekoisen hermoston varaan. Rakenne on saanut inspiraationsa ihmisaivojen neuroneista. Syväoppimismalli osaa tunnistaa tärkeitä piirteitä datasta itse, eikä ihmisten tarvitse erikseen kertoa, mitä mallin pitää etsiä. Malli myös oppii virheistään ja parantaa tuloksiaan toiston kautta.

Syväoppiminen vaatii paljon dataa — usein miljoonia esimerkkejä — ja sen kouluttaminen on hitaampaa ja kalliimpaa kuin yksinkertaisemmilla menetelmillä.

Diffuusio

Diffuusio on tekniikka, joka on monien kuvia, musiikkia tai tekstiä tuottavien tekoälymallien ytimessä. Ideana on, että malli oppii ensin "tuhoamaan" dataa lisäämällä siihen kohinaa, kunnes alkuperäistä ei enää tunnista. Sen jälkeen se opettelee tekemään tämän prosessin päinvastoin — eli palauttamaan kohinasta tunnistettavaa sisältöä. Näin malli oppii luomaan uutta sisältöä.

Tislaus (distillation)

Tislauksessa isompi tekoälymalli toimii "opettajana" ja pienempi malli "oppilaana". Opettajamallille lähetetään kysymyksiä ja sen vastaukset tallennetaan. Näillä vastauksilla koulutetaan sitten pienempi malli, joka pyrkii jäljittelemään opettajan toimintaa.

Tislauksen avulla voidaan luoda kevyempiä ja nopeampia malleja ilman, että laatu kärsii liikaa. Tekniikkaa käyttävät kaikki tekoälyyritykset sisäisesti. Kilpailijan mallin tislaaminen on kuitenkin yleensä kielletty palveluehtojen mukaan.

AI-sanakirja: Selitykset yleisimmille tekoälytermseille