Anthropic julkaisi eilen Opus- ja Sonnet-mallisarjojen uudet jäsenet, jotka ovat edeltäjiään kehittyneempiä koodauksessa, ohjeiden noudattamisessa ja päättelyssä. Yritys kuvaa uutta Opus 4:ää “maailman parhaaksi koodausmalliksi”.
Yrityksen mukaan Sonnet 4 taas on kehittynyt yleisessä päättelyssä ja ohjeiden noudattamisessa, mikä tekee siitä soveltuneen arkipäiväisiin tehtäviin.
Koodatessaan Opus 4 osaa MIT Technology Reviewin mukaan hyödyntää muistitiedostoja, jotka lisäävät sen autonomisia kyvykkyyksiä. Malli tallentaa tiedostoihin tärkeää tietoa työtehtävistään, mikä mahdollistaa pitkäjänteisemmän ja suunnitelmallisemman työskentelyn.
Kehittäjäyhteisö on ottanut Opuksen vastaan positiivisesti.
Sekä Opus 4 että Sonnet 4 ovat nk. hybridimalleja, jotka päättelevät ennen lopullista vastaustaan. Aidoista päättelymalleista (kuten OpenAI:n o-sarjasta) ne eroavat paitsi arkkitehtuurinsa myös alemman laskentatehon tarpeensa puolesta.
Julkaisuja varjostavat turvallisuushuolet
Joidenkin raporttien mukaan Claude Opus 4:llä on poikkeukselliset kyvyt käyttäjän strategiseen harhauttamiseen. Uskomukset kumpuavat Anthropicin turvallisuusraportista, jossa yritys kertoo Opus 4:n luoneen esimerkiksi väärennettyjä oikeudellisia asiakirjoja harhauttaakseen käyttäjää turvallisuustestauksessa.
Raportin tiedot ovat saaneet monet huolestumaan mallijulkaisun turvallisuudesta.
Anthropicin mukaan juuri julkaistulla Opus 4:llä ei kuitenkaan ole vastaavaa intressiä harhauttaa käyttäjiä. Kyseisessä testauksessa käytettiin mallista eri versiota, yritys kertoo.
Riippumaton testaajaryhmä myös totesi, että tekoäly tuskin onnistuisi käyttäjän harhauttamisessa, vaikka tämä toimisikin tietoisen epärehellisesti.
Testaustulokset ovat kuitenkin tärkeä muistutus, etteivät suurien kielimallien vaarat ole kadonneet. Mallien jatkokouluttaminen ja ohjaaminen eettisiksi toimijoiksi korostuu entisestään, kun niiden kyvyt laajenevat sekä päättelyn että työkalujen saralla.
Juuri julkaistuja malleja, Opus 4:ää sekä Sonnetia, voi käyttää Anthropicin API:n, Amazon Bedrockin ja Googlen Vertex AI:n kautta. Ilmaiskäyttäjät voivat kokeilla malleista vain edullisempaa Sonnet 4:ää esimerkiksi Anthropicin nettisivujen kautta.