TranslateGemma: otvoreni AI prevoditeljski modeli koji rade na svim uređajima

Tehnološka zajednica dobila je moćan novi alat u obliku kolekcije otvorenih modela za prevođenje TranslateGemma. Izgrađeni na temeljima arhitekture Gemma 3 unutar Googleovog AI odjela DeepMind, ovi modeli dolaze u tri veličine – s 4, 12 i 27 milijardi parametara. Glavni cilj projekta je omogućiti kvalitetnu komunikaciju na (za sada) 55 svjetskih jezika, neovisno o lokaciji korisnika ili hardveru koji posjeduju, od moćnih poslužitelja do svakodnevnih mobilnih uređaja.

Lokalni Google Translate

Posebnost ove serije leži u procesu “destilacije” znanja iz naprednijih velikih modela u kompaktne formate visokih performansi. Takav pristup omogućio je stvaranje sustava u kojem visoka kvaliteta prijevoda više ne zahtijeva ogromne računalne resurse, pa će TranslateGemma postati pristupačnom širokom krugu programera i istraživača diljem svijeta.

Tehnička evaluacija pokazala je iznimne rezultate u pogledu učinkovitosti. Model od 12 milijardi parametara nadmašio je osnovni model Gemma 3 od 27 milijardi parametara prema službenim benchmark testovima. Za programere to znači postizanje veće točnosti uz upola manje parametara, što izravno utječe na bržu obradu podataka i smanjenje latencije u radu njihovih aplikacija.

Sličan uspjeh zabilježen je i kod najmanjeg modela od 4 milijarde parametara, koji snagom parira znatno većim prethodnicima. Testiranja su obuhvatila širok spektar jezičnih obitelji, uključujući jezike s bogatim resursima poput kineskog i hindua, ali i one s manje dostupnih podataka. U svim kategorijama TranslateGemma je značajno smanjila stopu pogrešaka u odnosu na standardne modele, pohvalio se DeepMind.

Od mobitela do oblaka

Osim tekstualnih mogućnosti, ovi modeli zadržavaju i multimodalne karakteristike sustava Gemma 3, što znači da su sposobni i za obradu teksta unutar slika. Modeli su dizajnirani da budu robusna osnova koju istraživači mogu dalje prilagođavati specifičnim jezičnim parovima.

Hrvatski se nalazi na listi jezika na koje je omogućeno prevođenje samo s engleskog. Potpuna podrška našeg jezika za ostale jezične parove tek se očekuje

Dostupnost u tri različite veličine osigurava primjenu u raznolikim okruženjima. Dok je 4B verzija optimizirana za mobilne uređaje, 12B model je idealan za rad na korisničkim prijenosnim računalima. Najsnažnija verzija od 27B parametara namijenjena je radu u oblaku, gdje na jednoj grafičkoj kartici ili TPU procesoru osigurava maksimalnu vjernost prijevoda.

Možda i najzanimljivija činjenica kod ovog je lansiranja to što su sva tri modela otvorenog koda, dakle besplatni za korištenje i preuzimanje te daljnju prilagodbu vlastitim potrebama. Već sada dostupni su na servisima Kaggle i Hugging Face kao i u Googleovoj platformi za strojno učenje Vertex AI.