Googlen tekoäly-yksikkö DeepMind on julkistanut uuden videomallin, Veo 2:n, joka haastaa tosissaan OpenAI:n kehittämän Sora-mallin tekoälyvideoiden kärkituotteena. DeepMindin uusin tekoäly voi luoda yli kahden minuutin pituisia videoita jopa 4K-tarkkuudella (4096 x 2160 pikseliä).
Vertailun vuoksi OpenAI:n Sora-malli pystyy tuottamaan korkeintaan 20 sekunnin mittaisia videoita 1080p-tarkkuudella.
Toistaiseksi ero on toiseen suuntaan sillä Google rajoittaa toistaiseksi videoiden resoluution 720p:hen ja keston kahdeksaan sekuntiin kokeellisessa VideoFX-työkalussaan.
Veo 2 on käytettävissä Google DeepMindin VideoFX-alustalla, johon pääsee vain jonotuslistan kautta. Google lupaa päästää alustalle lisää käyttäjiä lähiviikkoina. Yhtiön mukaan Veo 2 tuodaan myöhemmin saataville myös Googlen Vertex AI -kehittäjäalustalle, kun malli on valmis laajempaan käyttöön.
Veo 2 eroaa edeltäjästään erityisesti tarkempien tekstuurien, liikkeiden ja valaistuksen mallintamisessa. Tekoäly kykenee myös hallitsemaan kameraefektejä paremmin, mikä mahdollistaa realistisemmat kuvakulmat ja monimutkaisempien kohtausten luomisen. DeepMindin mukaan uusi malli osaa myös mallintaa tarkemmin nesteiden liikehdintää, valon heijastuksia sekä ihmisten ilmeitä.
DeepMindin julkaisemat esimerkit Veo 2:n videoista osoittavat kehitystä erityisesti animaation ja realististen efektien suhteen. Kehittyneestä teknologiasta huolimatta Veo 2 ei vieläkään vältä aivan kaikkia epäjohdonmukaisuuksia videoiden sisällöissä.
Veo 2 on opetettu suurilla määrillä videodataa. DeepMind ei ole tarkentanut, mistä kyseinen data on peräisin. On mahdollista, että koulutuksessa on hyödynnetty YouTube-sisältöä, sillä Google omistaa YouTuben. DeepMindin mukaan koulutusdata koostuu videoista ja niihin liitetyistä kuvauksista.
Tekoälymallien koulutus herättää yhä keskustelua tekijänoikeuksista ja taiteilijoiden oikeuksista. Monet luovan alan toimijat ovat arvostelleet tekoälyjä tekijänoikeusrikkomuksista. Google on kuitenkin linjannut, että koulutus julkisella datalla on yhtiön näkemyksen mukaan oikeutettua.
Katso alta Google DeepMindin julkaisemia Veo 2:lla tehtyjä videoita.