OZ_2018_1-2

4 ORGANIZACIJA ZNANJA 2018, LETN. 23, ZV. 1 - 2 podatkovnih elementov smiselne glede na celoten zapis opisovanega vira in celotne baze zapisov (prim. Badovinac, 2017; Krstulović, 2006). Ne nazadnje smo se odločili, da bo oblikovanje nabora dimenzij temeljilo na kombinaciji teoretskega in raziskovalnega pristopa: pri izbiri poimenovanj in pomenov dimenzij smo se poskušali približati strokovni literaturi; na osnovi analize priporočil, ki so nastala ob pregledu dnevne produkcije v letu 2017, pa smo izdelali tipologijo napak v podatkih, ki jih lahko zaznamo v okviru posamezne dimenzije. Pregled literature V strokovnih virih najdemo različne izraze za pojem dimenzije , npr. smernice, indikatorji, parametri, razsežnosti, kazalci, pogoji, zahteve, atributi, komponente ipd. Pregled literature s področja katalogizacije je pokazal manjšo uporabnost dosedanjih izsledkov. V preteklosti ni bilo večjega zanimanja za dimenzije, prevladovali sta le dve: točnost in popolnost, in sicer kot minimalna pogoja za kakovost zapisov kot celote, pogosto pa sta bili opisani ohlapno (prim. Badovinac, 2017; Snow, 2017). Novejši poskusi razširitve nabora dimenzij so za naše potrebe po eni strani zastavljeni preširoko, saj zajamejo tudi značilnosti, npr. sheme, družbeni kontekst idr. (prim. Bruce in Hilman, 2004; Stvilia in sodelavci, 2007). Po drugi strani sta izbor in namen dimenzij usmerjena na ozko področje, npr. dimenzija časovnosti pri normativnih zapisih (Moulaison, 2015) ali dimenzije, povezane z zagotavljanjem kakovosti posameznega informacijskega sistema in servisov, kot je ISSN (Oury, 2017). Pregledali smo tudi nekaj virov s področja kakovosti podatkov nasploh, npr. Batini in Scannapiecco (2016) ter Redman, Fox in Levitin (2009), ki so prav tako le posredno vplivali na oblikovanje in poimenovanje dimenzij. Posredno smo uporabili Kriterije za ocenjevanja bibliografskih zapisov v COBISS.SI (2009), ki so bili zasnovani za spremljanje kakovosti 100 naključno izbranih zapisov na leto in ki so namenjeni vrednotenju zapisa kot celote (prim. Kavčič, 2012). Ti kriteriji kažejo stopnjo obveznosti, pomembnosti ali drugo značilnost podatkovnega elementa. Tipologija napak na osnovi priporočil v okviru spremljanja kakovosti bibliografskih in normativnih zapisov dnevne produkcije v COBIB.SI Priporočila k bibliografskim in normativnim zapisom nastajajo na podlagi metodologije zajema, vzorčenja in pregleda v okviru aktivnosti spremljanja zapisov dnevne produkcije COBIB.SI. V skladu s tem je treba upoštevati, da gre za majhen vzorec (letno je pregledanih približno 2.500 bibliografskih zapisov s pripadajočimi normativnimi zapisi), da gre za pregled brez primarnega gradiva in da gre za pregled z metodo ekspertnega mnenja (prim. Hider in Tan, 2008). Raven zanesljivosti priporočil zvišujemo s strokovnimi posveti sodelavcev in odzivi katalogizatorjev, poleg tega pa ob zaključku aktivnosti na letni ravni preverimo odzivnost katalogizatorjev in ustreznost popravljenih zapisov ter hkrati razumljivost in ustreznost priporočil. Popis priporočil temelji na določilih referenčnega vira, kreator zapisa napake odpravi ročno (prim. Dornik, et al., 2017). Značilnost teh podatkov je, da so v času kontrole kakovosti razmeroma stabilni, zapisi so pregledani v 6 dneh po datumu kreiranja in v tem času jih redko redigirajo drugi katalogizatorji. V popisu pregleda uporabljamo dve obliki priporočil za opis pomanjkljivosti. Prva oblika omogoča razmeroma preprosto identifikacijo tipa napake, saj je struktura naslednja: Oznaka polja/bloka: [Vrsta napake] v polju/podpolju/ bloku. Pojasnilo k napaki. Referenčni vir pojasnila. Ta oblika ima še dve podvariaciji. V primeru manj zanesljivega priporočila uporabimo naslednjo strukturo: Oznaka polja/ bloka: Preverite vir, [vrsta napake] v polju/podpolju/bloku (?). Pojasnilo k napaki. Referenčni vir pojasnila . Če gre za tip pomanjkljivosti, ki je po referenčnih virih neobvezen podatek, uporabimo strukturo: Oznaka polja: Priporočamo [npr. vnos] podatka v polju/podpolju (?). Referenčni vir priporočila . Kadar pa zaznamo pomanjkljivosti na nivoju zapisa, kot so napake pri izbiri predloge zapisa (maska), odnosu do drugih zapisov (npr. duplikati) ali odnosu do drugih baz podatkov (npr. predrugačenje prenesenih zapisov), navedemo splošno, manj strukturirano opombo. V letu 2017 smo izvedli 40 zajemov (skupaj 22.051 bibliografskih zapisov), v vzorec je bilo vključenih in pregledanih 2.196 bibliografskih zapisov s pripadajočimi normativnimi zapisi. Te zapise je kreiralo 378 različnih katalogizatorjev iz 185 različnih ustanov. K bibliografskim in pripadajočim normativnim zapisom smo napisali 2.279 priporočil glede na posamezne podatkovne elemente. Ker nas ni zanimala pogostost posameznih priporočil, temveč raznovrstnost, smo iz vzorca izločili dvojnike priporočil v posameznem podatkovnem elementu. Na podlagi 416 enoličnih priporočil smo identificirali 15 vrst napak (tabela 1); le-te izhajajo iz podatkovnih zahtev v obliki kontrolnih vprašanj, ki jih uporabljamo pri pregledu zapisa. V tabeli 1 so z zvezdico označene vrste napak na nivoju zapisa. V tabelo smo dodali tudi dve napaki, in sicer dvojnik zapisa in predelan zapis (iz drugih baz podatkov), ki ju v vzorcu iz leta 2017 nismo zabeležili. Za boljše razumevanje vrste napake so navedeni tudi načini odprave napake. Branka Badovinac: NABOR DIMENZIJ ZA OPREDELITEV KAKOVOSTI PODATKOV ...

RkJQdWJsaXNoZXIy MTAxMzI5