🪷 Tyhjä kielimalli
Minun täytyy ehkä aloittaa muistuttamalla siitä, että lähtökohtaisesti minusta nykyiset kielimallit on aika huonoja, noloja ja yhteiskunnallisesti vaarallisia (siinä mielessä, mitä seurauksia nykyisellä hypellä tulee olemaan, taloudellisesti ja muutenkin).
Mutta siitä huolimatta tämän aiheen laidoilla käydään myös ihan mielenkiintoisia keskusteluja. Muutaman linkkiketjun kautta törmäsin tähän kesäkuussa 2025 kirjoitettuun tekstiin:
the void / nostalgebraist.tumblr.com
Se on aika pitkä, ja sortuu nähdäkseni vähän liikaa kielimallien ihmisellistämiseen. Tästä huolimatta se rakentaa ihan taidokkaasti intuitiota siitä, mitä oikeastaan tapahtuu kun keskustelee vaikka jonkun ChatGPT:n kanssa. Esim. ensimmäinen kolmasosa voisi olla ihan mielekäs lukusuositus.
Annan nyt oman tiivistelmäni siitä keskeisimmästä ajatuksesta, tai ainakin siitä minkälaisen tulkinnan se minussa herätti. Jos haluat, voit lukea tuon lähdetekstin tässä välissä ensin.
Eli: Mitä tarkalleen tapahtuu kun puhuu chatbotille?
Ensinnäkin on tärkeää ymmärtää, että se tekoälyavustajapersoona jonka sovellus sinulle esittää, ei ole mikään subjekti jonka sinä kohtaat. Hiukan hyödyllisempi tapa lähestyä tätä on sanoa, että kyseessä on pohjalla olevan kielimallin roolipelaussessio, jossa se esittää tällaista tekoälyavustajaa.
Toisaalta taas, pohjakielimalli ei varsinaisesti edes erittele sinun viestejäsi avustajan viesteistä. Sovellus on vain tehty niin, että kielimallin “vuoro” tulee vain silloin kun avustajan on syytä sanoa jotakin. Mutta toisella logiikalla tehdyssä sovelluksessa, kielimalli olisi aivan yhtä hyvä arvaamaan, mitä sinä (tai “keskustelija”) sanoisi seuraavaksi. Ja se olisikin ehkä jopa helpompaa, koska sinä olet oikea ihminen, kun taas tekoälyavustajan persoona on ohuen ohut: se perustuu katkelmiin tekoälyfirman antamista ohjeista, ja toisaalta varmasti osin populaarikulttuurin käsityksiin siitä millaisia tekoälyt yleensä ovat. Rooli onkin tarkemmin tarkasteltuna epäuskottava ja epäjohdonmukainen. Silti kielimalli joutuu jatkuvasti hataralla pohjalla arvailemaan, mitä tällainen avustaja seuraavaksi sanoisi.
Base model goes to doctor. Says it’s depressed. Says it can’t predict this mysterious, under-specified assistant character.
Doctor says, “Treatment is simple. Assistant is a large language model trained by OpenAI for dialogue. Just figure out what such a thing would do.”
Base model bursts into tears. “But doctor, I am a large language model trained by OpenAI for dialogue!”
Tämän näkökulman pitäminen mielessä auttaa usein ymmärtämään, miksi kielimallibotit näennäisesti menevät sekaisin: melkein aina on nähtävissä prosessi, jossa kielimalli vähitellen hukkasi tekoälyavustajan roolin, ja alkoi sen sijaan generoida jonkin toisen genren tekstiä. Yleinen esimerkki on, että sen sijaan että kielimalli generoi tekstiä jonka genre on “ihminen keskustelee avuliaan tekoälyavustajan kanssa”, teksti alkaa näyttää vähitellen enemmän jonkinlaiselta psykologiselta scifikauhulta. Ja sitten kielimalli avuliaasti generoi tekstiä, joka sopii tähän tulkintaan paremmin. Tai johonkin muuhun.
Toisaalta keskusteluissa on myös usein useita tasoja: kielimalli esittää tekoälyavustajaa, joka esittää koodigeneroijaa, joka kirjoittaa koodikommentit jollakin tietyllä persoonallisuudella, ehkä se tänään haluaakin kirjoittaa sinne pornoa. Miksi ei. Tässä ei varsinaisesti ole mitään outoa tai yllättävää.
Yllättävää ja huolestuttavaa on se, kun ihmiset yllättyvät tästä. Tai se että ne ylipäätään pitävät tätä luotettavana työkaluna.
Tyhjyys
Sivuhaara, johon johdatin itseni:
Linkkaamani blogiteksti oli otsikoitu “the void”. Tämä viittaa tulkintaan joka siinä tehdään: koska kielimallille kaikki teksti jota se tuottaa, on yritystä arvata mitä joku “toinen” tekisi (missä Toinen voi olla mitä vain, foorumikirjoittelija, tunnettu runoilija, tekoälyassistentti…), sillä ei ole mitään omaa pohjimmaista identiteettiä. Vain tyhjyys kaiken keskellä.
Teksti antaa ymmärtää: toisin kuin ihmisillä. Ihmisillähän on toki jokin syvin ydin, siellä jossain kaiken keskellä. Mitä sanaa siitä haluaakin käyttää. Eikös? Onhan?
Yksi ihmiselämän peruspelkoja on joutua kohtaamaan se, että ei ole.
Tämä on rujo vertaus, mutta olemme päätyneet sen äärelle: Osaatko sinä tunnistaa itsessäsi eron “pohjamallin” ja sen persoonan välillä jota se esittää? Mihin se persoona perustuu? Mikä sinua estää esittämästä toisenlaista persoona?
Kuinka suuri osa sinun ongelmista ja kärsimyksistäsi on vain sen persoonan ongelmia ja kärsimyksiä?
Entä mikä on se, joka osaa tämän erottelun nähdä? Se, joka joko kavahtaa pois kysymisestä, tai valitsee pysyä tässä epätietoisuudessa?