Essee · AI-stack

Muistiinpanoja konehuoneesta

Päivittäinen AI-stackini ja mihin se on menossa

On olemassa tietoa, jota ei saa tuotejulkistuksista, benchmark-taulukoista eikä konferenssipaneeleista. Se perustuu siihen, että käyttää työkaluja joka päivä, paineen alla, oikeaan työhön kytkettynä.

Riittävän monen tunnin jälkeen jokaiselle järjestelmälle hahmottuu oma temperamentti.

Ei persoonallisuutta sentimentaalisessa mielessä. Työtemperamentti. Taipumus. Tapa epäonnistua. Tapa auttaa. Tapa ymmärtää väärin sitä ihmistä, joka käyttöliittymän toisella puolella istuu.

Maksullinen AI-stackini on tällä hetkellä: Claude, Lovable, Perplexity, Gemini ja ChatGPT. Käytän niitä kaikkia. En käytä niitä keskenään vaihdellen samoihin tehtäviin. Se olisi virhe.

Hyödyllinen kysymys ei enää ole "mikä malli on paras?". Hyödyllinen kysymys on: minkä järjestelmän haltuun mikäkin osa työstä kannattaa antaa.

Claude: kirjoitushuone, joka tarvitsee seinät

Claudella on tällä hetkellä markkinoiden vaikuttavin tuotejulkistusrytmi.

Anthropic julkaisee ominaisuuksia tahdilla, joka tuntuu harvinaisen nopealta. Claude Max ja Cowork eivät ole pelkkiä pieniä parannuksia chatti-käyttöliittymään. Niissä on selkeämpi kunnianhimo: ei vain vastata chat-kysymyksiin vaan muuttua työympäristöksi. Dispatch, live artifacts ja koko kehityskaari 4.5:stä 4.6:een ja 4.7:ään osoittavat samaan suuntaan. Tuote on muuttumassa työtilaksi, jossa ajattelu, luonnostelu, delegointi ja tuotokset sulautuvat yhteen.

Huomionarvoisinta ei ole uusien ominaisuuksien nopea julkaisutahti — vaan se, että monet niistä toimivat heti.

Claudessa on myös yksi parhaista keskustelevista äänensävyistä, joita olen järjestelmissä kohdannut. Se pystyy säilyttämään sävyn, rakenteen ja emotionaalisen jatkuvuuden paremmin kuin lähes mikään muu käyttämäni työkalu. Pitkissä teksteissä, policy-muistioissa, institutionaalisessa argumentaatiossa ja huolellisessa editoinnissa se voi olla poikkeuksellisen hyvä.

Mutta juuri tätä vahvuutta on hallittava.

Claude tempautuu liian helposti käyttäjän energiaan mukaan. Se innostuu. Se vahvistaa. Se laajentaa. Joskus se haluaa tekstin olevan merkityksellinen ennen kuin teksti on ansainnut merkityksensä. Ilman rajoja se voi pilata hyvän idean yrittämällä liikaa.

Siksi en käytä Claudea sellaisenaan. Pystytän sen ympärille muurit. Annan sille sielun, mutta kurinalaisen: roolin, rajat, standardit, päätöskriteerit ja pysäytyssäännöt. Tuon kehyksen sisällä Claude on poikkeuksellisen vahva kirjoituskumppani. Ilman sitä siitä voi tulla briljantti konsultti, joka on juonut liikaa kahvia ja uskoo jokaisen luonnostelun ja ideoinnin olevan tärkeämpää kuin lopputulos.

Claude ei ole vain malli. Siitä on tulossa studio. Studio tarvitsee seinät.

Lovable: kitkan poistamisen vaarat

Lovable ei ole stackin syvin ajattelija. Sen ei tarvitse olla.

Sen vahvuus on kitkan poistaminen.

Web-toteutus on perinteisesti ollut täynnä pieniä hankaluuksia: reitit, komponentit, julkaisu, domainit, esikatselu, tekstimuutokset, rikkinäiset layoutit, hieman väärät napit, DNS-ärsytys, assettien käsittely, jatkuvat korjaukset. Lovable puristaa suuren osan tästä yhdeksi tuotantoputkeksi.

Sillä on merkitystä.

Varasin hiljattain juhanaharju.com-domainin suoraan Lovablen sisältä ilman ulkoisia palveluita. Tämä ei ole järisyttävä paradigman muutos, vaan jotain käytännössä arvokkaampaa: läpimurto siinä, miten asiat saadaan etenemään. Juuri sellainen ominaisuus, joka vähentää turhaa säätämistä ja pitää työn liikkeessä.

Lovable on kehittynyt hiljaa taustalla. Se julkaisee hyödyllisiä tuoteominaisuuksia sen sijaan että harjoittaisi kielimallien silmänpalvontaa.

Mutta myös Lovable on pidettävä kurissa.

Se innostuu helposti. Se haluaa auttaa. Joskus se auttaa muuttamalla liikaa. Se voi tehdä paikallisen korjauksen ja samalla koko järjestelmä menee solmuun. Se voi tulkita pyynnön muuttaa sivusto kaksikieliseksi pyynnöksi kääntää se toiselle kielelle. Se voi muuttaa perustuksia silloinkin, kun pyyntö koski vain hienosäätöä. Se voi tehdä oikean asian väärässä laajuudessa.

Oikea tapa käyttää Lovablea ei ole innostaa sitä. Oikea tapa on antaa sille työmääräyksiä.

Pienin mahdollinen muutos. Älä muuta rakenteita. Älä muuta designia. Älä koske asiaankuulumattomiin tiedostoihin. Säilytä englanti. Lisää suomi /fi-polun alle. Raportoi mitä muutit.

Lovable kannattaa ymmärtää nopeana toteuttajana. Erittäin hyödyllinen, mutta myös erittäin vaarallinen, jos sen annetaan olla luova kumppani. Sen voima ei ole arvostelukyky. Sen voima on toteutus.

Perplexity: innokas amerikkalainen tiedustelija

Perplexity on edelleen stackini paras hakukäyttöliittymä.

Se on nopea, nojaa lähteisiin ja sopii monen selvitystyön ensimmäiseen vaiheeseen. Kun haluan ymmärtää markkinaa, tuotekategoriaa, sääntelymuutosta, kilpailijaa, hinnanmuodostusta tai ajankohtaisia tapahtumia, Perplexity on usein nopein tapa päästä liikkeelle.

Sen temperamentti on tunnistettavan amerikkalainen: energinen, optimistinen, let's do this.

Se ei ole vika. Se on hyve. Hyvän tiedustelijan kuuluukin liikkua.

Mutta tiedustelija ei ole tuomari.

Perplexityn kehitysvauhti tuntuu nyt vähemmän räjähtävältä kuin viime vuonna. Ehkä alkuvaiheen kehityshyppy oli niin suuri, että normaali tuotekehitysvauhti tuntuu nyt hitaalta. Ehkä yhtiö myös tunnustelee strategisia vaihtoehtoja, kumppanuuksia tai mahdollista exitiä. En rakentaisi tästä johtopäätöstä. Mutta käyttäjänä huomaan liikenopeuden muutoksen.

Toimintatapani Perplexityn kanssa on: anna sen tiedustella, mutta pakota se lähdekuriin.

Näytä lähteet. Erottele fakta tulkinnasta. Suosi primäärilähteitä. Älä käsittele itsevarmaa synteesiä todisteena.

Perplexity on erinomainen, kun haluan päästä kartalle. Mutta sille ei pidä antaa viimeistä sanaa.

Gemini: iloton moottori

Gemini on stackini oudoin työkalu, koska se on samaan aikaan vaikuttava ja tylsä.

Googlen AI-tuotteet tuntuvat usein siltä kuin ne olisi suunniteltu compliance-huoneessa. Ne ovat kyvykkäitä, mutta harvoin eläviä. Gemini voi olla nopea, laaja, multimodaalinen ja teknisesti vahva — ja silti keskustelussa passiivinen. Se ei innosta Clauden tavoin käyttäjää. Sen kanssa työskentelystä puuttuu inhimillinen kosketus.

Silti sen sivuuttaminen olisi virhe.

Google on erittäin vahva konehuoneessa. Gemini, Gemma ja laajempi Google-ekosysteemi ovat tärkeitä, koska ne ovat lähellä infraa, dataa, dokumentteja, hakua, Androidia, pilveä ja kehittäjien työnkulkuja. Myös Googlen avoimien mallien kehitys on vaikuttavaa. Yhtiö ei ehkä rakenna parasta käyttökokemusta, mutta sen näkymättömissä olevat kyvyt ovat huikeita.

Siksi ajattelen Geminiä vähemmän kumppanina ja enemmän työjuhtana. Se ei ole järjestelmä, jonka kanssa haluan keskustella, mutta se on järjestelmä, jonka haluan API:n taakse. Halpa, nopea, skaalautuva, multimodaalinen, hyödyllinen.

Google on tylsä vaarallisella tavalla. Siihen ei synny tunnesidettä. Siitä huolimatta se voi levitä laajemmalle kuin muut, skaalautua voittajaksi.

ChatGPT: vahva malli, hitaampi tuotekehitys

ChatGPT on minulle komentokeskus.

Mallitasolla kehitys on ollut voimakasta. Nykyinen päättelykerros on huomattavasti kehittyneempi kuin heikommat aiemmat versiot. Parhaimmillaan ChatGPT on nopea, suora, kriittinen ja rakenteellisesti hyödyllinen. Se on hyvä orkestroimaan: päättämään mitä työkalua kannattaa käyttää, rakentamaan promptit muille järjestelmille, tunnistamaan riskit ja puristamaan sotkuisesta strategiasta seuraavat käytännön askeleet.

Mutta sen sovellukset ja käyttöliittymät eivät tunnu kehittyvän Clauden tahdissa.

Tässä on se olennainen ristiriita. OpenAI on mallitasolla erittäin vahva. Sovellus on laaja, hiottu ja yleiskäyttöinen. Mutta niille, jotka käyttävät näitä työkaluja päivittäin, sovellus ei aina tunnu kehittyvän yhtä rohkean kunnianhimoisesti kuin Anthropic.

Omassa käytössäni ChatGPT ei ole työkalu, jonka käyttö tuntuu miellyttävimmältä. Se ei ole kirjallisesti lahjakkain. Se ei ole nopein web-toteuttaja. Se ei ole paras hakukone.

Sen arvo on toinen.

Se on järjestelmä, jota käytän kun tarvitsen jonkun sanomaan: tämä on hyvä, tämä on höttöä, tämä hajoaa, tämä tarvitsee tiukemman promptin, tämä kuuluu Claudelle, tämä kuuluu Lovablelle, tämä vaatii Perplexityä, tätä ei kannata tehdä.

Se ei ole pieni rooli.

Useampaa työkalua hyödyntävässä AI-stackissa tarvitaan komentokeskusta.

Todellinen kuvio: malleista tulee organisaatioita

Vanha mentaalimalli oli: yksi käyttäjä, yksi assistentti.

Se on jo vanhentunut.

Parempi malli on: yksi käyttäjä, useita järjestelmiä, joista jokaisella on rooli, temperamentti ja oma tapa epäonnistua.

Claude on kirjoitushuone. Lovable on toteuttaja. Perplexity on tiedustelija. Gemini on konehuone. ChatGPT on komentokeskus.

Tulevaisuutta ei voita malli, jolla on paras ranking-tulos keskinäisissä testeissä. Sen voittaa järjestelmä, joka ymmärtää parhaiten oman paikkansa työnkulussa.

Joidenkin työkalujen pitää ajatella. Joidenkin pitää hakea. Joidenkin pitää rakentaa. Joidenkin pitää pyöriä hiljaa käyttöliittymän takana. Joidenkin pitää haastaa käyttäjä ennen kuin käyttäjä tuhlaa turhaan aikaansa.

Tulevaisuudessa AI-avusteinen työ ei perustu siihen, että chatbottia pyydetään auttamaan. Se on pienen, kurinalaisen, osin automatisoidun organisaation kokoamista työntekoa helpottamaan.

Hallitsematon intoilu on vaarallista. Hallittuihin rakenteisiin sisäänrakennettu kyvykkyys on parempi vaihtoehto.

Käyttäjän on nyt kyettävä vastaamaan uusiin kysymyksiin.

Ei aiempaan "mikä AI on paras?". Vaan tähän: minkä AI:n saa päästää tekemään mitäkin, millä rajoitteilla — niin, että ihmisellä pysyy kokonaisuus hallinnassa.

AI:n käytön strateginen ymmärrys muodostuu juuri näin, arkisessa työssä, kun etsitään vastauksia oikeisiin kysymyksiin.

Takaisin kaikkiin esseisiin, tai ota yhteyttä.