Podcast: Kako osigurati kvalitetu podataka za AI

anketa.plus
Izvor: anketa.plus

Razgovaramo sa Cody Davidom sinaliziranja o tome kako osigurati kvalitetu podataka u skupovima podataka u AI-u, zašto je stav “prvog podataka” ključan, a brzi osvojio organizaciju može dobiti u kvaliteti podataka

Od

  • Antony Adshead,Urednik skladišta

Objavljeno: 26. februara 2025. godine

U ovom podcastu razgovaramo sa Cody Davidom, rješenjima Architect sa sinlinijom, što je dio Capgemini, o važnosti osiguranja kvalitete podataka za umjetnu inteligenciju (AI) radnog opterećenja.

Biti u stanju vjerovati AI-u je srž njegove upotrebe, kaže on. I evo moramo biti sigurni da su njegovi ishodi pouzdani. To će samo biti slučaj ako je AI obučen na skupu podataka koji nije pun duplikata i nepotpunih podataka.

U međuvremenu, AI, tvrdi David, mogu se koristiti za pomoć u kvaliteti podataka, kao što su pronalaženjem problema u skupovima podataka koji mogu dovesti do pogrešnih ishoda.

Veliko za poneti je da su organizacije trebaju stav “prvog podataka” tako da AI može obaviti svoj rad i proizvesti pouzdane rezultate koji se mogu vjerovati, a on ocrtava brze pobjede koje se mogu steći.

Koji su ključni izazovi u kvaliteti podataka u preduzeću za slučajeve upotrebe AI?

Jedan od najvećih izazova u kvaliteti podataka za AI koji vidim je povjerenje.

Mnogi ljudi gledaju AI sistem kao jednu crnu kutiju. Kada proizvodi pogrešan uvid ili radnju, nazivaju ga AI greškom i gube samopouzdanje. Ponekad trajno, mogu izgubiti to samopouzdanje.

Stvarno pitanje, međutim, često leži u lošem kvalitetu podataka. To je složeno zbog nedostatka razumijevanja kako AI rješenja istinski rade.



Razmotrite prodajnu organizaciju. Imaju CRM [customer relationship management system] I ima duplikat zapisa kupaca. A AI rješenje je pogrešno postavlja vaše najbolje kupce jer ne prevrću sve transakcije na jedan račun.

Dakle, prodajni tim optužuje AI alat, nikada ne shvaćajući da su osnovni uzrok zapravo loši ili nedosljedni podaci. Ovo je primjer onoga što nazivamo kvalitetom podataka za AI; Osiguravanje da su podaci precizni i spremni za one procese upravljane AI-om.

Na flip stranici postoji i AI za kvalitet podataka, gdje AI rješenje zapravo može pomoći otkriti i spajati te duplikatne evidencije koje smo upravo dali u tom primjeru. Mislim da je još jedan izazov da je kvalitet podataka povijesno bio pokus. Organizacije često skaču u AI bez ovog mentaliteta podataka i prije osiguravanja da imaju taj čvrsti podaci.

Dakle, imate ove naslijeđene sisteme, ove legacije ERP [enterprise resource planning] Sistemi sa hiljadama tablica i decenijama složenih pitanja podataka.

Da svi dodaju ovoj složenosti. I zato je važno da se proaktivno bavi problemima kvaliteta podataka, a ne pokušavamo pregraditi rješenja nakon što te Ai inicijative ne uspiju. Moramo staviti taj podatak unaprijed i središte tih AI inicijativa, a zatim uspostaviti to stabilno rješenje koje će podržati one pouzdane ai izlaze.

Koji su ključni koraci koje organizacija može poduzeti kako bi osigurao kvalitet podataka za AI?

Mislim da sistematski pristup uvijek započinje upravljanje podacima.

A to su zaista politike za prikupljanje podataka, pohranjene, čišćene, dijeljenje i saznanje ko je pravi vlasnik određenih poslovnih procesa ili skupova podataka. Ključno je shvatiti ko je odgovoran za te standarde.

Mislim da sledeće želite da prioritetujete. Umjesto da pokušavate riješiti sve odjednom, fokusirajte se na one područja koja pružaju najveći poslovni utjecaj. To je vrlo ključna fraza: Koji je najveći poslovni utjecaj onoga što pokušavate riješiti što se tiče kvalitete podataka? I shvatite one koji hrane vaša AI rješenja.

Ovdje ćete vidjeti te brze pobjede. Sada će biti zabrinutosti budžeta koje se često pojavljuju kada počnete govoriti o ovim kvalitetom podataka, programima upravljanja podacima. I ironično je skupo raditi sa lošim podacima dugoročno.

Mislim da je praktično rješenje započeti male. Odaberite kritički poslovni proces sa mjerljivim financijskim utjecajima. Koristite to kao pilota da pokaže te stvarne uštede u ROI-u [return on investment].

I nakon što pokažete te poboljšanja kvaliteta podataka dovode do opipljivih koristi, poput smanjenja troškova ili većeg obrtnog kapitala, imat ćete snažniji slučaj s upravom za šire investicije u upravljanje podacima. Te bi trebalo ugraditi i te prakse kvaliteta podataka u protok rada podataka. Na primjer, integrirajte pravila za provjeru validacije u upravljanje vašim podacima, tako da se pogreške mogu odmah uhvatiti, sprječavajući da podaci o tim rješenjima.

Ako ne možete ovako unijeti validacije, na vaše stvaranje podataka, morate staviti sustave i obrade na svoje mjesto da biste ih uhvatili odmah putem automatiziranog izvještavanja.

I na kraju, rekao bih da se uvijek fokusiramo na to stalno poboljšanje. Izmjerite mjerne podatke o kvaliteti podataka i upotrijebite ih za pokretanje iterativnih prerade tkanjem tog upravljanja podacima u vašu organizaciju, dokazujući svoju vrijednost putem onih ciljanih pilota, a zatim stvarate taj održivi temelj za povjerene inicijative.

Konačno, pitao sam se da li možete dati primjer jedno ili dvije brze pobjede koje preduzeća mogu dobiti u pogledu kvaliteta podataka i poboljšanju kvaliteta podataka za AI?

Postoji nekoliko različitih primjera gdje pokušavamo dobiti brze pobjede za kvalitetu podataka, posebno kada pokušavate dobiti vrlo brze rois i velike poslovne procese.

Ako uzmete ERP sistem, imamo ono što nazivamo MRO materijalima. To su oni koji su dijelovi opreme u proizvodnom procesu. A kad imate te materijale, obično držite sigurnosnu zalihu ili količinu tih predmeta koji bi vam omogućili popravak tih mašina.

Ako biljka padne, potencijalno ćete izgubiti milione dolara dnevno. A ako imate duplikat materijala, kao primjer, pohranite više nego što vam treba. I to je obrtni kapital da, ako biste ispravili taj kvalitet podataka, oslobodite tu obrtna sredstva.

A onda, naravno, možete koristiti taj obrtni kapital za ostale delove svojih inicijativa.

Još jedan bi bio možda popust za dobavljače. Ako imate dobavljače koji se dupliciraju u sistemu, a oni imaju pravo na rabati na osnovu iznosa novca koji troše, neće realizirati te posebne rabate. To bi moglo biti područje u kojem biste mogli imati i uštedu troškova.

Pročitajte više o poslovnoj inteligenciji i analitici

  • Rag AI: ‘Uradi to sam,’ kaže naučnik NYC podataka

    Napisao: Antony Adshead

  • Inženjering podataka – Pryon: Pretvaranje haosa u jasnoću

    Napisao: Adrian Bridgwater

  • AI Stvaranje mogućnosti skladištenja

    Napisao: Simon Quicke

  • Direktor Exity Grupe dijeli AI iskustva

    Napisao: Simon Quicke