OpenAI:n uusimmalla kielimallilla on tohtoritason päättelykyvyt
Uuden o1-mallin esikatseluversio soveltuu kuitenkin toistaiseksi vain rajoitettuihin käyttötarkoituksiin.
Max Lehtinen
13.9.2024

OpenAI julkaisi tänään esikatseluversion sen tuoreimmasta päättelyyn erikoistuneesta kielimallista, jota markkinoidaan tutun ChatGPT-nimen sijaan lyhyesti nimellä “o1”. 

Nimen järjestysluku merkkaa yrityksen mukaan paluuta alkuun. Malli eroaa aiemmista chatboteista perustavanlaatuisesti. 

Uunituore o1 ja sen sisar-chatbotti o1-mini on koulutettu OpenAI:n kehittämällä uudella vahvistusoppimisalgoritmilla (reinforcement learning), joka keskittyy aiempaa enemmän luonnollisen kielen mallintamisen sijaan omaan “ajatteluun”. 

OpenAI ei paljasta merkittäviä yksityiskohtia kehittämästään uudesta koulutusalgoritmista. 

Yritys kuitenkin kertoo o1:n päihittävän ohjelmoinnissa jopa 89 prosenttia koodauskilpailu Codeforcesin osallistujista. 

Teknologiajätti väittää mallin yltävän samalla tohtoritason osaamiseen matematiikassa, fysiikassa, biologiassa ja kemiassa. Matematiikan olympialaisissa se päihitti OpenAI:n mukaan 89 prosenttia osallistujista, kun yrityksen aiempi lippulaivamalli ChatGPT-4o saavutti vastaavassa testissä vain 13 prosentin merkkipaalun. 

Uuden mallin vastaanotto on ollut myös teknologia-alalla erittäin positiivinen. 

Esimerkiksi Piilaaksossa tekoälytyökaluja kehittävä Cognition.ai arvioi o1:n päättelykyvyn olevan selkeästi OpenAI:n aiempia malleja kehittyneempi. 

“o1:n esikatseluversiolla on hämmästyttävä kyky pohtia ja analysoida. Se palaa usein ajatusprosessin alkuun ja harkitsee eri vaihtoehtoja ennen kuin päätyy oikeaan ratkaisuun”, yritys kirjoittaa blogissaan

Uusi o1 ei kuitenkaan ole kaikilla tavoilla yhtä tehokas tai käytännöllinen kuin GPT-4o. Sillä ei esimerkiksi ole yhtä paljon maailmaa koskevaa faktatietoa sen koulutustavan vuoksi. 

Se ei myöskään pysty selaamaan internetiä tai käsittelemään erilaisia tiedostoja, kuten kuvia. Lisäksi Cognition.ai:n mukaan tarkat kehotteet voivat jopa huonontaa mallin suorituskykyä, mikä johtaa suurempaan vaihteluväliin mallin vastausten laadussa. 

Merkittävin puute kuitenkin on o1:n uuden toimintatavan tuomat lisäkustannukset. Tekoälyn taipumus tarkastella vastauksiensa laatua ja loogisuutta vaatii merkittävästi aiempaa enemmän aikaa sekä laskentatehoa. 

Ei ole yllättävää, että tällä hetkellä mallin vastausajat ja API-hinnat ovat OpenAI:n aiempiin chatbotteihin verrattuna moninkertaiset.

Mallia on toistaiseksi vaikea käyttää arkisiin tehtäviin myös, koska sen esikatseluversion käyttörajat on määritetty hyvin alhaisiksi. 

Käytännöllisistä ongelmista huolimatta mallin innovatiivinen toimintatapa on merkittävä edistysaskel kohti inhimillistä älykkyyttä, OpenAI sanoo. 

Teknologiajätti väittää uuden toimintavan olevan myös hyödyksi ihmisen ja tekoälyn väliselle yhteistyölle, sillä ihminen pääsee näkemään mallin ajatteluprosessin askeleet selkeämmin. 

o1-mallin esikatseluversio on OpenAI:n mukaan toistaiseksi vain ChatGPT-tilaajien käytettävissä. Yritys kuitenkin suunnittelee julkaisevansa mallista myös ilmaisversion.

Suositellut

Uusimmat