Tehnološka zajednica dobila je moćan novi alat u obliku kolekcije otvorenih modela za prevođenje TranslateGemma. Izgrađeni na temeljima arhitekture Gemma 3 unutar Googleovog AI odjela DeepMind, ovi modeli dolaze u tri veličine – s 4, 12 i 27 milijardi parametara. Glavni cilj projekta je omogućiti kvalitetnu komunikaciju na (za sada) 55 svjetskih jezika, neovisno o lokaciji korisnika ili hardveru koji posjeduju, od moćnih poslužitelja do svakodnevnih mobilnih uređaja.
Lokalni Google Translate
Posebnost ove serije leži u procesu “destilacije” znanja iz naprednijih velikih modela u kompaktne formate visokih performansi. Takav pristup omogućio je stvaranje sustava u kojem visoka kvaliteta prijevoda više ne zahtijeva ogromne računalne resurse, pa će TranslateGemma postati pristupačnom širokom krugu programera i istraživača diljem svijeta.
Tehnička evaluacija pokazala je iznimne rezultate u pogledu učinkovitosti. Model od 12 milijardi parametara nadmašio je osnovni model Gemma 3 od 27 milijardi parametara prema službenim benchmark testovima. Za programere to znači postizanje veće točnosti uz upola manje parametara, što izravno utječe na bržu obradu podataka i smanjenje latencije u radu njihovih aplikacija.
Sličan uspjeh zabilježen je i kod najmanjeg modela od 4 milijarde parametara, koji snagom parira znatno većim prethodnicima. Testiranja su obuhvatila širok spektar jezičnih obitelji, uključujući jezike s bogatim resursima poput kineskog i hindua, ali i one s manje dostupnih podataka. U svim kategorijama TranslateGemma je značajno smanjila stopu pogrešaka u odnosu na standardne modele, pohvalio se DeepMind.
Od mobitela do oblaka
Osim tekstualnih mogućnosti, ovi modeli zadržavaju i multimodalne karakteristike sustava Gemma 3, što znači da su sposobni i za obradu teksta unutar slika. Modeli su dizajnirani da budu robusna osnova koju istraživači mogu dalje prilagođavati specifičnim jezičnim parovima.
Dostupnost u tri različite veličine osigurava primjenu u raznolikim okruženjima. Dok je 4B verzija optimizirana za mobilne uređaje, 12B model je idealan za rad na korisničkim prijenosnim računalima. Najsnažnija verzija od 27B parametara namijenjena je radu u oblaku, gdje na jednoj grafičkoj kartici ili TPU procesoru osigurava maksimalnu vjernost prijevoda.
Možda i najzanimljivija činjenica kod ovog je lansiranja to što su sva tri modela otvorenog koda, dakle besplatni za korištenje i preuzimanje te daljnju prilagodbu vlastitim potrebama. Već sada dostupni su na servisima Kaggle i Hugging Face kao i u Googleovoj platformi za strojno učenje Vertex AI.