Zašto Velika Britanija mora dovesti do podataka za otključavanje punog potencijala AI-a

anketa.plus
Izvor: anketa.plus

Osim ako se podatkovni silosi u vladi ne obraćaju, rizici u Velikoj Britaniji koji nedostaju ambiciozni ciljevi Akcionog plana da vode u AI usvajanju

Od

  • Elena Simpl i Neil Majithia

Objavljeno: 10 feb 2025

Vlada Velike Britanije ima neke od najvrjednijih svjetskih skupova podataka, uključujući službenu statistiku, zapise kulturne baštine i zdravstvene podatke NHS-a. Ove skupove podataka imaju naučne proboj, poslovne inovacije i poboljšanja javnih usluga.

Objavljivanjem mnogo očekivanih AI mogućnosti AI mogućnosti, transformativni potencijal državnih podataka za AI nikada nije bio vidljiviji. Međutim, nedavna istraživanja Instituta za otvoreni podaci (ODI) otkriva kritične nedostatke u tome kako se vladine skupove podataka pripremaju i objavljuju za Ai.

Podaci o vladi i AI-jev izazov pouzdanosti

Modeli temelja (FMS), kao što su ChatGpt i Blizanci, sve se više koriste za pružanje informacija o javnim politikama i uslugama. Ipak, Istraživanje ODI-a ističe da, dok ovi modeli ogrevaju prehrambene reprezentacije podataka, često ne uspijevaju donijeti precizne izlaze na osnovu njih. Umjesto toga, modeli crpe na sekundarnim ili nepouzdanim izvorima, poput mjesta društvenih medija ili članka mišljenja ili jednostavno izmišljene odgovore.

Posljedice su značajne. Građani koriste AI alate za razumijevanje prava na koristi mogu dobiti pogrešne ili nepotpune savjete, podrivanje javnog povjerenja u AI i vladine usluge. To se posebno odnosi na s obzirom na naglasak Vlade u Velikoj Britaniji o poboljšanju isporuke javnih usluga putem AI inovacija.

Deficit podataka u AI ekosustavu

AIP AIPRIJSKI AKCIJSKI PLAN, autor Mat Clifford, s pravom naglašava ulogu nacionalne biblioteke podataka (NDL) kao sredstvo za otključavanje podataka vlade za AI inovatore. Ipak, trenutno stanje državnih podataka pruža značajne prepreke za postizanje ove vizije.

ODI Analiza zajedničkog spremišta podataka za AI modele za AI modele, otkrila je da je izbacio 13.556 stranica iz Data.gov.uk od 2024. aprila. Međutim, ove stranice rijetko su doprinijele preciznim izlazima modela. Preko 195 testnih upita, modeli su pravilno referentni podaci.gov.uk statistiku u samo pet slučajeva.

Ovo se pitanje pojavljuje jer se podaci vlade često ne objavljuju u formatu gotovih AI. Iako se tehnologije poput DCAT-a koriste za izradu podataka o odlagalištima, otklanjanje infrastrukture poput Commonchawl ne podržava u potpunosti ove tehnologije. Kao rezultat toga, AI se modeli oslanjaju na manje autoritativne izvore, čineći dezinformacije. Odni nalazi sugeriraju da bi ambicija u Velikoj Britaniji da vodi u AI inovacijama, ako se ovaj prekid veze ne uspije.

Dokazi iz pokusa ODI

ODI je sproveo dva eksperimenta za ispitivanje kako podaci vlade podržavaju AI modele i, zauzvrat, kako su modeli AI omogućeni da podrže stanovnike Velike Britanije.

Prvi eksperiment analizirao je koliko su važne veb stranice u Velikoj Britaniji za Ai. Istraživači su proveli ablacijsku studiju koristeći “mašinu bez ikakvog tehnika” za uklanjanje web stranica Gov.uk iz izboru podataka o treningu FMS-a.

Rezultati su otkrili porast od 42,6% u modelima netočnošću kada je lišen sadržaj Gov.uk, što dovodi do osnovnih grešaka. Na primjer, jedan test je utvrdio da modeli koji nisu imali pristup vladinim web stranicama koji nisu definirali korisnike o njihovoj podobnosti za dječiju korist.

Suprotno tome, drugi eksperiment je utvrdio da su vladine skupove podataka trenutno nepoznati AI modelima. Ovaj eksperiment, studija modela “sposobnost da se prisjeti specifičnih statistika iz podataka.gov.uk, ustanovila je da su iz 195 upita, modeli precizno uputili službenu vladinu statistiku otpuštanja samo pet puta.

Zaključak iz ovih eksperimenata bio je taj što su vladine web stranice od vitalne važnosti za tačnost AI, podaci o državnoj statistici su nedovoljno iskorišteni uprkos njihovoj ogromnoj vrijednosti i potencijalu u pružanju javnih usluga. Ako želimo da realizujemo potencijal AI-a da pružimo koristi kao što su poboljšanje kvaliteta zaštite, sigurnosti i isplativosti u NHS-u, vlada mora dati prioritet poboljšanju kvalitete, pristupačnosti i upotrebljivosti njegovih podataka.

Put naprijed

Usvajanje fer principa – osiguravanje podataka je otkriti, dostupni, interoperabilni i za višekratni – dugo je prepun Data.gov.uk i ostaje jak temelj. Alati za nastajanje poput kroasana, strojno čitljiv format metapodataka dizajniran za mašinsko učenje, može dodatno poboljšati otkrivanje i integraciju u radne tokove programera. Ako se poboljšaju opisi skupa podataka, oni će biti korisniji za korisnike ljudi i stroja.

Vlada mora podstaći odgovorne dijeljenje podataka kako bi se osigurao pravičan pristup visokokvalitetnim podacima. To bi moglo uključivati ​​porezne olakšice za razmjenu podataka privatnog sektora, mandati za javno financirane projekte kako bi se njihovi podaci otvorili tamo gdje je prikladno ili čak namet na sadržaju generiranja Ai za financiranje pouzdanih izvora informacija. Moramo koristiti tehnologije za poboljšanje privatnosti kao što su solid, koji nude pojedince izravnim pristupom i kontroli njihovih podataka – na primjer, njihovo blagostanje i zdravstvene podatke – kako bi se osigurao pristup osjetljivim podacima bez ugrožavanja lične privatnosti, komercijalne osjetljivosti ili nacionalne sigurnosti. To bi moglo pružiti važne koristi, poput upotrebe mašinskog učenja za identifikaciju faktora osobnih rizika za zdravstvene uvjete, omogućavajući preventivno djelovanje. Poverenja podataka mogu se izgraditi na vrhu čvrstog do zbirnih podataka. Ovaj se zbirni podaci mogu prikupiti u skupove podataka s kroasnim metapodacima da bi se pripremili za istraživačku upotrebu.

Usklađivanje s akcionim planom

AIP AI MOGUNOSTI AKCIJSKI PLAN PRIKLJUČAVANJA NA KVALITETNIM PODACIMA I SNAJNOG UPRAVLJANJA UVJETIO SA DUŽNIM DRUGIM ODOBRENOM SOCIO-TEHNIČNOM RJEŠENJU UGRADNJU PRIDRUŽENOG PODRUČJA INFRASTRUKTURA SA JAVNOM TRUSTVOM. Da bi podržao razvoj interoperabilnih sistema, AI-spremne skupove podataka i tehnologije za poboljšanje privatnosti, ODI se zalaže za desetogodišnju nacionalnu mapu infrastrukture podataka. Ovaj plan puta podržao bi fokus akcionog plana na vožnju AI inovacija kroz ulaganje u dugoročnu infrastrukturu podataka.

Međutim, akcioni plan ostavlja nekoliko praznina bez obrade. Ne u potpunosti se ne detaljno opisuje kako će nacionalna biblioteka podataka sadržavati korisnički unos ili uključiti različite dionike kako bi se osiguralo da pruža javnu korist. Postoji ograničen detalj o formalnim standardima za kvalitetu podataka i provedbu, koji su kritični za osiguranje podataka Spremnika AI-a. Nadalje, dok akcioni plan ističe potrebu za podrškom AI inovatorima, to bi moglo izričito poticati startupe u centru podataka specijalizirani za pripremu podataka i alate za upravljanje podacima. Nadamo se da su ove praznine adresirane dok vlada iznosi preporuke.

Međunarodno rukovodstvo kroz saradnju

Istraživanje ODI naglašava globalni značaj pristupa centralnoj podacima AI upravljanju. Međutim, nekoliko nacija prioritetju ovaj fokus, riskiranje podrivanja šireg usvajanja otvorenih i zajedničkih podataka podataka. Bez robusnog upravljanja u centru podataka, temelji transparentnog i odgovornosti AI sistema mogu oslabiti.

ODI je pokrenuo globalnu opservatoriju podataka o politici AI za rješavanje toga. Ova inicijativa pruža praktične resurse za podršku kreatorima politika u razvoju Uprave za AI u razvoju podataka. Nudeći uvid u mašinski čitljive metapodatke, alate za odgovorno korištenje podataka i najbolje prakse za transparentnost, za cilj opservatorija za jačanje globalne baze dokaza AI.

Shvatanjem potencijala Velike Britanije

Pristup visokokvalitetnim podacima vlade su neophodni za realizaciju AI-ovog potencijala u pružanju javnih usluga. Poboljšanje podataka o objavljivanju podataka i ulaganja u dugoročnu infrastrukturu, Velika Britanija može se pozicionirati kao globalni lider u pružanju podataka za Ai. Ovo rukovodstvo će otključati transformativne ekonomske i socijalne koristi, usklađivanje s ambicijama AI mogućnosti AI mogućnosti.

Potpuni izvještaj je dostupan za preuzimanje na Izvještaj ODI: Vlada Velike Britanije kao dobavljač podataka za Ai.

Elena Simpl je direktorica istraživanja na ODI. Neil Majithia je istraživač na ODI.

Pročitajte više o umjetnoj inteligenciji, automatizaciji i robotici