OZ_2018_1-2

3 ORGANIZACIJA ZNANJA 2018, LETN. 23, ZV. 1 - 2 preglednejše razumevanje analiz vsebine priporočil, ki smo jih zapisali pri pregledu zapisov. DIMENZIJE Kakor navaja strokovna literatura, za opredelitev kakovosti podatkov najprej potrebujemo nabor dimenzij (prim. Badovinac, 2017). Z dimenzijo namreč kvalitativno opišemo, kakšne podatke si želimo. Dimenzije dajejo kvalitativno razumevanje kontrole kakovosti, ki je del splošnega okvira zagotavljanja kakovosti (slika 1). Na podlagi posamezne dimenzije kasneje določimo mere in metode merjenja ter vrednotenje kakovosti podatkov. Slika 1: Splošni okvir zagotavljanja kakovosti podatkov v bibliografskih in normativnih zapisih Dimenzije niso neodvisne, med njimi obstajajo korelacije, ki so določene s specifiko proučevanega področja. V strokovnih virih obstaja mnogo različnih opredelitev, poimenovanj in kategorizacij dimenzij. S pragmatičnega vidika morajo biti dimenzije osnovane smiselno, da jim lahko določimo merljive atribute (prim. Batini in Scannapiecco, 2016). Z večjim številom dimenzij lahko natančneje opišemo kakovost podatka. Dimenzije lahko oblikujemo po določenih značilnostih, tako npr. Redman, Fox in Levitin (2009) ločijo naslednje tri skupine: kakovost konceptualnega modela, kakovost vrednosti in kakovost reprezentacije. Wang in Strong (1996) ločita naslednje štiri skupine dimenzij: inherentne, kontekstualne in predstavitvene dimenzije ter dimenzije, ki omogočajo dostopnost podatkov. Inherentne so tiste dimenzije, ki zajamejo kakovost podatka takšnega, kot je; kontekstualne upoštevajo kontekst uporabe podatkov; predstavitvene so osredotočene na obliko podatkov; dostopnost pa je tisti segment, ki določa varnost in dostopnost podatka. Avtorja sta opozorila, da odločitev, katere dimenzije so pomembne za določeno opredelitev kakovosti, lahko izhaja iz teoretskega, intuitivnega ali raziskovalnega pristopa. Izbiramo pa lahko tudi med različnimi metodami določanja dimenzij, npr. intervjuji, analiza literature, študije uporabnikov ipd. METODOLO[KA ZASNOVA Za potrebe analiz, ki nastajajo na podlagi aktivnosti spremljanja kakovosti bibliografskih in normativnih zapisov dnevne produkcije, želimo nabor dimenzij, ki se bo osredotočil le na podatke v bibliografskih in normativnih zapisih. V skladu s tem se ne ukvarjamo s kakovostjo konceptualnih modelov in njihovih podatkovnih domen, ki jih v nadaljevanju poimenujemo referenčni vir (katalogizijski pravilniki, formati itn.). Naš namen v prvi vrsti torej ni ovrednotenje referenčnega vira v COBIB.SI , temveč zaznava težav, na podlagi katerih se oblikujejo nadaljnje aktivnosti za izboljšanje kakovosti podatkov, kar je naslednji nivo v splošnem okviru zagotavljanja kakovosti podatkov (npr. uvedba programskih kontrol, dopolnjevanje dokumentacije) (slika 1). Podatek je v našem primeru vsebina ali natančneje vrednost podpolja in vrednost indikatorja v okviru posameznega podatkovnega elementa, kot to definira format COMARC (slika 2). Podatkovni element je v formatih MARC najmanjša informacijska enota, ki jo je mogoče nedvoumno prepoznati (Bibliotekarski terminološki slovar, 2009). Zapis v formatu COMARC je sestavljen iz 1) označevalcev vsebine (oznake polj, podpolj, indikatorjev), ki so namenjeni prepoznavanju podatkovnih elementov in omogočajo nadaljnje upravljanje z zapisom, in 2) vsebine podatkovnih elementov, običajno definirane s standardi, ki niso del formata, npr. s katalogizacijskimi pravili. Posamezno polje lahko vsebuje enega ali več podatkovnih elementov, ki lahko dopolnjujejo pomen indikatorja. Indikator je numerični znak v polju, ki prinaša dodatne informacije o vsebini polja/ podpolja, o relacijah med polji v zapisu ali o aktivnostih za rabo podatkov (prim. Brešar, 2004). V skladu s podatkovnimi zahtevami referenčnih virov nas specifično zanimata dve skupini dimenzij, ki se nanašajo na kakovost vrednosti (angl. data value ) in kakovost reprezentacije (oblike) podatkov (angl. data format, data representation ) (prim. Redman, et al., 2009; Badovinac, 2017). Slednje se nanaša le na tiste podatkovne elemente, v katere se podatki vnašajo v pol- ali nestrukturirani obliki, npr. blok 2XX in 3XX, in tista kodirana podpolja, v katerih oblika/struktura podatkov ni programsko kontrolirana (npr. podpolje 127a). Vrednost indikatorja pa je vedno le kodiran in strukturiran podatek. Vsi ti podatki so besedilni ali numerično določeni z naborom znakov COBISS. Slika 2: Primer dveh podatkov v zapisu formata COMARC Glede na opredelitev našega podatka se torej oziramo po trendu granulacije in dekonstrukcije zapisa, saj je kontrola kakovosti usmerjena na posamezne podatkovne elemente zapisa, čeprav morajo biti struktura, zastopanost in vsebina Branka Badovinac: NABOR DIMENZIJ ZA OPREDELITEV KAKOVOSTI PODATKOV ...

RkJQdWJsaXNoZXIy MTAxMzI5