Čvrsta CTO buši se na ključnu vrijednost, nema DFM-a na Fa // i brz objekt

anketa.plus
Izvor: anketa.plus

Od

  • Antony Adshead,Urednik skladištenja

Objavljeno: 26. jun 2025

U ovom podcastu, evidentirano na prošlotjednom čistoj manifestaciji, razgovaramo sa čistom glavnom oficiru za čisto skladištenje (CTO), kako bi se izvršio vježbi za čistoću prodavaonica u cestori u Flash-u u obliku.

Možete li objasniti kako se trgovina ključnim vrijednostima koristi u čistim proizvodima za pohranu?

Razlog za koji koristimo trgovinu ključnim vrijednostima, a ja ću ući u prednosti, puno je istih razloga koji kada organizujete velike količine informacija, koristite relacijsku bazu podataka.

Informacije organizirate na vrlo uredan način u tablice. Možete izgraditi indekse. Možete izgledati vrlo efikasno. Skloni ste to učinite, umjesto da samo pohranite gomile i gomile podataka neorganizovanim i otežavate vrlo teško pogledati.

Sada, geneza korištenja prodavaonica ključnih vrijednosti u našim proizvodima i softveru vraća se u dan.

Jedna od stvari koje smo radili vrlo drugačije od svih ostalih na tržištu bili smo dizajnirani i ponovno je dostavljao softver za pohranu, uključujući datotečne sustave i način na koji se logičkim blokovima mapiramo na fizičke lokacije. Pretpostavljali smo kako gradite onima za kako Flash radi na najvišoj razini. Jedna od ključnih razmatranja sa bljeskalicom je, za razliku od magnetskih tvrdih diskova, ne prepisujete sadržaj na mjestu.



Da biste promijenili sadržaj, morate napisati novu kopiju i morate za smeće prikupiti staru stvar. A kad to radite, želite izbjeći prepisivanje istog komada bljeskalice iznova i iznova da izgorete medije.

Pa, ispada da organiziranjem naših metapodataka – što je učinkovito tako mapiranje, ako ćete, ako želite, datotečni sustav na fizičku lokaciju, iz istraživačke zajednice, iz istraživačke zajednice, a broj mjesta za pisanje – broj vremena koje moramo prepisati strukturu metapodataka i održavati ga s vremenom.

Dakle, to je bio ključ – nema kaznene kazne – uvid koji nas vozi da organizujemo naše metapodatke u prodavaonicama ključnih vrijednosti.

Drugi komad – i opet, pozajmljivanje iz svijeta baze podataka i zašto vidite toliko prodavaonica ključnih vrijednosti koje se koriste u oblaku Cloud – da li su to zaista lako pregrade i distribuiraju i stvaraju i stvaraju paralelizam.

I tako kad pogledate flashblade i zašto je flashblade jedinstveno dobar u Metapodaci performansi – razgovarao sam o tome na pozornici [at Pure//Accelerate 2025]Sa flashblade EXA – je zato što čuvamo sve te metapodatke u prodavnici ključne vrijednosti koja nam omogućava vrlo, vrlo, vrlo linearno i s vrlo visokom istodobnom, izveštavanjem na način koji jednostavno ne možete učiniti s drugim strukturama podataka.

Da biste izvukli vrlo jednostavnu usporedbu, povijesno, većina sustava za pohranu organizirala je svoje podatke u strukturi nalik drvetu. Pa, ako razmislite kako izgledate nešto u drvetu, započinjete na vrhu, otići si, otići, ideš udesno, otići si, moraš da slijediš korak po korak po korak.

[It’s] Vrlo je teško paralelno paralelno, zar ne? Sa trgovinom ključnom vrijednošću možete iskoristiti medij, bljeskalicu, paralelni pristup, možete iskoristiti našu distribuiranu tehnologiju i možete izgledati sa vrlo velikom brzinom, s vrlo velikom istodobnom brzinom.

Da li u trgovini ključnim vrijednostima dolazi u rad samo na nivou metapodataka i da li je datotečni sistem netaknut negdje drugdje, koji radi paralelno s tim?

Što je stvarno lijepo u tome kako smo izgradili naš softver, koristimo li jedan pristup upravljanju metapodacima datoteka, korisničkim metapodacima, kao i našim fizičkim metapodacima, ako hoćete. Sve preslikavanje između … Kao što znate, mi radimo smanjenje podataka, zar ne? Pa, kada napravite smanjenje podataka i pronalazite deduplikaciju, morate zadržati mapiranje koje kaže: “Oh, nemam ovaj blok fizički pohranjen ovdje, tamo je zasebna kopija.”

Pa, to je mapiranje; To smo stavili u trgovinu ključnim vrijednostima. Dakle, koristeći isti pristup u upravljanju svim našim metapodacima, a, to je manje softver za pisanje, B, to možemo učiniti zaista robusnim i zaista, stvarno, bilo da je to datotečni sistem, bilo da je to naše fizičko upravljanje medijima, dobijte prednosti nekretnina koje sam upravo razgovarao.

Čisto čini veliku bavljenje upotrebom svojih DirectFlash modula (DFMS) i kapaciteta koji mogu postići, a ipak ih novo najavljeni FlashRay // ne koristi. Šta koristi i zašto?

Dakle, to je sjajno pitanje i pogledajte, počet ću s filozofijom koju imamo iza našeg hardvera. Mislim da je to bio Steve Jobs koji su rekli, ako želite izgraditi zaista dobar softver, napravite hardver kako bi to podržao i to je zaista vrsta naše filozofije. Ako pogledate DirectFlash, ono što čini DFMS rad je softver koji im omogućava.

Trudimo se da vrlo malo stavimo u dfm hardver. To je omogućiti softver.

Sada, razlog zašto ne koristimo DFMS-a ili se ne koristim sa bilo kojim dizajnom, sa bilo kojim dizajnom, dizajnirajući za raspon dizajnerskih prostora, performansi, efikasnosti, troškova itd. I našeg DFM-a, vrlo su dizajnirani za vrlo širok spektar potreba za poduzećem u pogledu efikasnosti, kapaciteta itd.

Sa brzim i sa flashblade EXA-om, ciljamo na ultra, ultra visok kraj, gornji kraj performansi, a jednostavno nismo dizajnirali naše pogone za taj gornji nivo ultra performansi. Postoji širi ekosistem dobavljača hardvera koji imaju više specijaliziranih proizvoda za one dijelove dizajnerskog prostora, pa gdje ima smisla dodirnuti na to tržište komponenti, idemo u to.

Šta konkretno DFMS ne ima da imate u hardveru koji tamo koristite?

Pa, opet, ne postoji određena komponenta na koju idete ukazati. Tako sam optimizirao dizajn DFM-a i kako se koristi, nasuprot trguju latency, moć, prostor, kapacitet itd. I jednostavno nismo optimizirali one za latenciju mikrosekunde, jer, opet nisu samo taj dio dizajnerskog prostora.

Još jedna od stvari koje se čisti rukovoditelji često odnose na mogućnost pružanja vrlo visoke performanse skladištenja objekta. Nikad nisam čuo objašnjenje zašto je to moguće. Da li je to samo slučaj izvlačenja resursa na njemu ili je tamo nešto drugo?

Apsolutno, i zapravo smo ga pogodili u prvom dijelu podcasta. Mnogo toga ima veze s načinom na koji organiziramo naše metapodatke u prodavnici ključnih vrijednosti i to vozi tonu performansi za nas.

Ako se vratimo nazad i gledamo na zaostavštine pristupe skladištenju objekta, skladište objekta u preduzeću je odrastao u eri jeftinog i dubokog. Ljudi su pokušali provoditi protokole objekta obično na vrhu datotečnog sustava, na temeljnom blok uređaju.

Imate slojeve i slojeve i slojeve neefikasnosti. Dakle, broj jedan je da nativno implementiramo predmet. Ne postoje slojevi i slojevi neefikasnosti koji usisavaju performanse. A onda je broj dva, ako pogledate na performanse u dva komada, jedan je metapodaci, administrativni rad, a potom komad podataka. Znači, želim nešto pogledati, imam ime, moram shvatiti gdje je, a kad jednom shvatim gdje je, onda imam podatkovni komad zapravo utovara i prebacivanje podataka.

Ispada se sa modernim radnim opterećenjima objekta, administrativnom komadu, metapodacima, završava vrlo veliki dio ukupnih zahtjeva za performanse. I opet, tu je naš rodni pristup, ne polaganje ga na vrhu datotečnog sustava i ima visoko distribuirano, vrlo paralelno pohranu ključnih vrijednosti, omogućava nam da dostavimo tu izvedbu. A onda sigurno imamo zaista brzu putanju podataka. To je od dana.

Pročitajte više o AI i Storage

  • Čisti ciljevi na AI izvan preduzeća sa flashblade // EXA

    Napisao: Antony Adshead

  • Da li je čisto dobio prvi od svojih “HDD-a je osuđen na patke zaredom?

    Napisao: Yann Serra

  • Čisto skladištenje, Micron proširuje QLC NAND partnerstvo

    Napisao: Adam Armstrong

  • Čisti izvršni direktor: AI treba brzina pisanja i skladišta na mjestu

    Napisao: Antony Adshead