sdecoret – stock.adobe.com
Meta želi učiniti umjetnu inteligenciju na raspolaganju svima koji koriste njegove platforme, ali skaliranje AI-a na preko milijardu ljudi neće biti jeftino
Od
- Cliff Saran,Upravljanje urednikom
Objavljeno: 19. februara 2025. 13:25
Vijesti da se rukuje na razvoju vlastitih podataka podataka za Meta, kako je izviješteno u Financial Timesukazuje na potez dizajnera Chip-a da iskoristite apetit tehničke industrije za pristupačnu, energetski efikasnu umjetnu inteligenciju (AI).
Hyperscalers i divovi društvenih medija kao što su meta koriste ogromne nizove skupih grafičkih jedinica za preradu (GPUS) za pokretanje radnog opterećenja koje zahtijevaju AI ubrzanje. Ali zajedno s troškovima, GPU-ovi imaju tendenciju da koriste puno energije i zahtijevaju ulaganja u tečno rashladnu infrastrukturu.
Meta vidi AI kao inicijativu strateške tehnologije koja obuhvaća svoje platforme, uključujući Facebook, Instagram i Whatapp. CEO Mark Zuckerberg pozicionira Meta AI kao umjetna inteligencija koju će svi koristiti. U najnovijim pozivom kompanije, rekao je: “U Ai očekujem da će ovo biti godina kada vrlo inteligentan i personalizirani AI asistent dosegne više od milijardu ljudi, a očekujem da će Meta Ai biti taj koji vodi Ai pomoćnica. “
Da bi se postigao ovaj obim ljudi, kompanija radi na skali svoje AI infrastrukture i planira premjestiti iz GPU-ove AI ubrzanja na prilagođene silikonske čipove, optimiziran za svoje radno opterećenje i datacentre.
Tokom poziva za zaradu, Meta Glavni finansijski oficir Susan Li rekao je da je kompanija “vrlo uložena u razvoj vlastitih prilagođenih silikona za jedinstvene radne opterećenja, gdje silicijum izvan polica nije nužno optimalan”.
Godine 2023. godine, kompanija je započela dugoročni poduhvat pod nazivom Meta trening i inferentni akcelerator (MTIA) kako bi pružio najefikasniju arhitekturu za svoje jedinstvene opterećenja.
Li je rekao da je Meta počela usvajati MTIA u prvoj polovini 2024. godine za osnovni rang i preporuke zaključivanja. “Nastavit ćemo da se usvajamo za ta radna opterećenja tokom 2025. godine, jer ga koristimo za inkrementalni kapacitet i za zamjenu nekih servera zasnovanih na GPU-u kada stignu na kraj svog korisnog života”, dodala je. “Sledeće godine nadamo se da ćemo proširiti Mtia da podrži neke od naših Core Ai opterećenja treninga i vremenom nekih naših GENA [generative AI] Koristite slučajeve. “
Učinkovitost vožnje i ukupni trošak vlasništva
Meta je prethodno rekao da je efikasnost jedan od najvažnijih faktora za raspoređivanje MTIA u svojim datacentrima. To se mjeri u metric-u performansi po vati (TFLOPS / W), koji je rekao je ključna komponenta ukupnih troškova vlasništva. MTIA čip postavljen je na otvorenu modulu platforme (OCP), koji troši oko 35W. Ali arhitektura MTIA zahtijeva centralnu obradu (CPU) zajedno sa sjećanjem i čipovima za povezivanje.
Prijavljeni rad koji radi s ARM-om mogao bi pomoći da se kompaniji pređe iz visoko prilagođenih integriranih krugova na aplikacije (ASICS) koji je razvio za svoj prvi generacijski čip, MTIA 1, na arhitekturu sljedeće generacije na temelju jezgara opće namjene .
Gledajući najnoviju zaradu ruku, kompanija se pozicionira da ponudi AI koji može efikasno skalirati snagu. ARM je prethodno udružio Nvidia da bi dostavio efikasan Efficiran AI u NVIDIA Blackwell Grace Architecture.
Na Showuder Electronics Showur, Nvidia je predstavio podrumčani GB10 Grace Blackwell Superchip, koji je tvrdio nudi petaflop AI računarstva za prototipiranje, fino podešavanje i pokretanje velikih modela AI. Čip koristi ručni procesor sa Nvidia’s Blackwell akceleratorom za poboljšanje performansi AI opterećenja.
Poluprovodnička industrija nudi sistem na čip (SoC) uređajima, gdje su različiti blokovi za računarsku zgradu integrirani u jedan čip. Grace Blackwell je primjer SOC-a. S obzirom na rad META radi razvijanje svog MTIA čipa, kompanija možda može istražiti kako može raditi s ARM-om na integrirati vlastitu tehnologiju s ARM CPU na jednom uređaju.
Iako je SOC složeniji iz perspektive izrade čipa, ekonomije razmjera kada se proizvodnja povećava, a činjenica da uređaj može integrirati nekoliko vanjskih komponenti u jedan paket, činiti ga značajno isplativim za graditelje sistema.
Napomene LI za zamjenu GPU servera i cilj MTIA-e za smanjenje ukupnih troškova vlasništva za AI za AI korelaciju sa prijavljenim bavljenjem AI-a, što bi potencijalno omogućilo da se ubrzava ubrzavanje AI ubrzanja.
Povećavanje oružja AI AI
ARM, koja je kompanija Softbank, nedavno se nađe u srži projektu Stargate Adut Administracije, inicijative koja podržava softbranke za implementaciju mogućnosti suverenih AI u SAD-u.
Tokom zarade za najnovije tromjesečne rezultate, izvršni direktor Rene Haas opisao je Stargate kao “izuzetno značajan infrastrukturni projekat”, dodajući: “Izuzetno smo uzbuđeni za CPU izbora za takvu platformu u kombinaciji sa Blackwell CPU-om sa [ARM-based] Grace. Naprijed, bit će ogroman potencijal za tehnološku inovaciju oko tog prostora. “
Haas je također govorio o suradnji Cristal Intelligence s Openaijem, koji je rekao da omogućava AI agentima da se presele na svakom čvoru hardverskog ekosustava. “Ako mislite o najmanjim uređajima, poput ušiju, sve do podataka datacentre, ovo se zapravo više o agentima sve više među sučelja i / ili vozač svega što vozi AI unutar uređaja”, dodao je.
Pročitajte više o umjetnoj inteligenciji, automatizaciji i robotici
-
10 top AI hardverske i čipove kompanije 2025. godine
Napisao: Devin Polazak
-
Supermicro lansira Nvidia Blackwell sisteme
Napisao: Antone Gonsalves
-
CES 2025: ARM timovi sa NVIDIA-e za pojačavanje softverskih vozila
Napisao: Joe O’Halloran
-
Intelov uspon i pad: vremenski okvir onoga što je pošlo po zlu
Napisao: Sean Kerner