Deepseek je pokazao kako je moguće pokrenuti AI model koristeći daleko manje izračunati od postojećih modela. AI Destilacija modela sada postaje ujednačena
Od
- Cliff Saran,Upravljanje urednikom
Objavljeno: 07. avgusta 2025. 12:40
Destilacija modela jedan je od tehnoloških trendova koji je dostigao nivo zrelosti identificiran u Gartnerovom ciklusu hipera Gartner-a za umjetnu inteligenciju (AI) kao “nagib prosvjetljenja”.
Međutim, iako je nedavno stavljen u reflektor u početku godine s destilacijom u kineskom jeziku koji se može koristiti za obuku iz modela velikog jezika (LLM) da se u Gartner-u ne radi o Harithi Khandabattu u Gartneru: “Zapravo sam istraživao destilaciju modela 2017.”
U stvari, tehnika datira na Univerzitetu Cornell 2006 Kompresija modela Papir Cristian Bucilă, Rich Caruana i Alexandru Niculescu-mizil. Devet godina kasnije, 2015. godine, Cornell University’s Destiliranje znanja u neuronskoj mreži Papir Geoffery Hinton, Oriol Vinyals i Jeff Dean koristili su termin destilaciju za opisivanje tehnike za poboljšanje performansi AI modela.
Iako se Gartner ne smatra novim tehnološkim razvojem, Khandabattu je rekao: “Destilacija modela je ponovo naglašena. Fondacijski modeli su izračunati gladni i izuzetno skupi za pokretanje, a preduzeća su počela da dobiju 80% nastupa u 10% troškova.”
Ona je rekla da je Deepseek doveo do trenda dole cijene za cijene u posljednjih šest do 12 mjeseci. No, a ne prilagođavanje tih promjena cijena, Khandabattu je preporučio da CIOS “Planira svoja upotreba slučajeva i prioritete uz očekivanje da će troškovi obuke i zaključavanja nastaviti pad”.
Khandabattu je rekao da čak i veliki ai pružatelji tehnologije prepoznaju korisnost destilacije modela kako bi se omogućilo postavljenije, prilagodljivije i više upravljatnije AI, dodavanje: “Destilacija modela konačno dobija komercijalnu vuču.”
Destilacija modela opisuje most između inovacija i skalabilnosti: “Destilacija modela otključava i tehničku zaslugu i pristup. Nudi manji troškovi za infrastrukture i IT infrastrukturni destilacija čini da su destilaciju modela za određene ai raspoređivanje.”
Ali Khandabattu je također napomenuo da postoje i drugi troškovi koje voditelj trebaju razmotriti izvan IT infrastrukture potrebne za pokretanje zaključka opterećenja. “Cio moraju biti izuzetno oprezni i prepoznati da ukupni trošak raspoređivanja GENAI [generative AI] Aplikacije nisu ograničene na troškove modela. “
Postoje inženjerski troškovi i troškovi povezani sa integriranjem AI sistema sa Enterprise-om, dodavanje: “Fino podešavanje AI modela košta mnogo novca. Ako se promeni model, a zatim morate promijeniti sve stvari koje ste izgradili na starijem modelu novijeg, što je vrlo skupo.”
Iza destilacije modela, rekla je: “Sa AI investicijom ostaju jak ove godine, oštrija naglasak stavlja se na korištenje AI za operativnu skalabilnost i inteligenciju u stvarnom vremenu.”
Prema Gartneru, to je dovelo do postepenog okretnog okretaja od generativnog AI-a kao centralnog fokusa, prema temeljnim eailerima koji podržavaju održivu isporuku AI, poput AI-spremnih podataka i agenata.
“Uprkos ogromnoj potencijalnoj poslovnoj vrijednosti AI, neće se smijati spontano”, rekao je Khandabattu. “Uspeh će ovisiti o dobrom poslovnim usklađenim pilotima, proaktivnim mjerenjem infrastrukture i koordinaciji između AI i poslovnih timova za stvaranje opipljive poslovne vrijednosti.”
Među AI inovacijama Gartner ima prognozu dostići usvajanje u narednih pet godina da su multimodalni AI i AI povjerenje, rizik i upravljanje sigurnosti (trizm).
Multimodalni AI modeli obučeni su s više vrsta podataka istovremeno, kao što su slike, video, audio i tekst. Trizam je fokusiran na slojeve tehničkih mogućnosti koji podržavaju politike preduzeća za sve slučajeve upotrebe AI i pomažu u osiguranju upravljanja AI, pouzdanosti, pravednosti, sigurnosti, pouzdanosti, sigurnosti, privatnosti i zaštitu podataka. Gartner je predvidio da će, u kombinaciji, ta kretanja omogućiti čvrste, inovativne i odgovorne AI aplikacije, pretvaranjem kako djeluju preduzeća i organizacije.
Gartner također očekuje da AI agenti budu najmanje dva do pet godina od postavljanja uinteresora.
“Da bi iskoristili prednosti AI agenata, organizacije trebaju odrediti najrelevantnije poslovne kontekst i koristiti slučajeve, što je izazovno da nijedan agent AI nije isti i svaka je situacija drugačija”, rekao je svaka situacija, “rekao je khandabattu. “Iako će AI agenti i dalje postati snažniji, ne mogu se koristiti u svakom slučaju, pa će koristiti u velikoj mjeri ovisiti o zahtjevima situacije pri ruci.”
Pročitajte više o umjetnoj inteligenciji, automatizaciji i robotici
-
Fino podešavanje za pružanje poslovnih ai vrijednosti
Napisao: Cliff Saran
-
Što Ainon Nova Premier otkriva o AI modelima i agentima
Napisao: Esther Shittu
-
Uloga malih jezičnih modela u preduzeću AI
Napisao: Cliff Saran
-
Sa Llamom 4, Meta UPS kolozi u utrci na otvorenom modelu
Napisao: Shaun Sutner