OZ 2010/4

144 ORGANIZACIJA ZNANJA 2010, LETN. 15, ZV. 4 Po inicialnem prenosu zapisov je IZUM začel četrtletno ažurirati podatke o zalogi že vključenih zapisov. Za zdaj se prenašajo podatki o zalogi naslednjih knjižnic: • Narodna in univerzitetna knjižnica, Ljubljana, • Centralna medicinska knjižnica, Ljubljana, • Centralna tehniška knjižnica Univerze v Ljubljani, • Centralna biotehniška knjižnica, Ljubljana, • Centralna ekonomska knjižnica, Ljubljana, • Osrednja družboslovna knjižnica Jožeta Goričarja, Ljubljana, • Osrednja humanistična knjižnica, Ljubljana, • Mariborska knjižnica, • Knjižnica Univerze v Novi Gorici, • Znanstveno-raziskovalno središče Koper. V OCLC se dejansko prenašajo samo kode teh knjižnic, ki se pri izpisu na spletnih straneh WorldCat razrešijo v nazive knjižnic. Vsak zapis v bazi podatkov WorldCat vsebuje tudi kodo SILIS za sistem COBISS.SI. Podatke, ki se prikazujejo v WorldCat (povezave na kataloge knjižnic in servise ter druge pomembne podatke), lahko knjižnice same pripravljajo preko aplikacije WorldCat Registry [9]. V naslednjih iteracijah je predviden tudi prenos podatkov o zalogi za večje število knjižnic (Slovenska akademija znanosti in umetnosti, Institut Jožef Stefan, Univerzitetna knjižnica Maribor, Mestna knjižnica Ljubljana in druge). Ko bo OCLC zaključil vključevanje zapisov iz inicialnega prenosa, se bodo četrtletno vključevali tudi novi zapisi iz vzajemne bibliografske baze podatkov COBIB.SI . ANALIZA ZAPISOV Baza podatkov WorldCat danes vsebuje več kot 180 milijonov zapisov in milijardo in pol podatkov o zalogi za več kot 72.000 knjižnic iz 171 držav. Pri vključevanju novih zapisov knjižnic je pomembna predvsem kakovost zapisov, ki mora ustrezati mednarodnim standardom in strogim kriterijem, ki jih je definiral OCLC. Nekakovostne zapise OCLC pri vključevanju v bazo podatkov WorldCat zavrne in jih mora knjižnica ali institucija pred ponovnim pošiljanjem ustrezno popraviti. Da neustreznih oz. nekakovostnih zapisov sploh ne bi prenašali, smo analizirali zapise v vzajemni bibliografski bazi podatkov COBIB.SI. Za prenos zapisov v bazo podatkov WorldCat je bilo možno izbirati med bibliografskima formatoma UNIMARC [10] in MARC 21. V IZUM-u smo se odločili za slednjega, ker je konverzija zapisov iz formata COMARC/B [11] v format MARC 21, ki smo jo razvili za potrebe protokola Z39.50 in prenosa podatkov v druge sisteme v programski opremi COBISS/OPAC, popolnejša od konverzije v format UNIMARC. Razen tega v OCLC uporabljajo bibliografski format, ki izhaja iz formata MARC 21. Če bi prenašali zapise v formatu UNIMARC, bi zapise najprej konvertirali v format MARC 21 in nato še v njihov format, pri čemer bi se lahko izgubila znatna količina podatkov. Da bi preverili ustreznost konvertiranih zapisov, smo poleg analize zapisov v formatu COMARC/B naredili še analizo zapisov v formatu MARC 21. Za ta namen je bil razvit preverjalnik zapisov MARC 21, s katerim so bile posredno ugotovljene tudi pomanjkljivosti zapisov v formatu COMARC/B. Preverjalnik zapisov MARC 21 preverja strukturo zapisov po specifikaciji MARC 21: • identifikatorje polj in identifikatorje podpolj, • indikatorje v posameznih poljih, • ponovljivost polj in podpolj, • izpolnjenost polj in podpolj, • dolžino uvodnika zapisa (24 znakov), • dolžine kontrolnih polj 006, 007 in 008 glede na vrsto gradiva, • kode v uvodniku in kontrolnih poljih 006, 007 in 008 glede na vrsto gradiva, • podatke, po katerih iščemo pare med zapisi iz vzajemne bibliografske baze COBIB.SI in zapisi iz baze podatkov WorldCat (algoritem je opisan v nadaljevanju pri opisu inicialnega prenosa zapisov). Na osnovi analize zapisov po obeh bibliografskih formatih (COMARC/B in MARC 21) smo iz vzajemne baze podatkov COBIB.SI najprej izločili naslednje zapise: • dogodke (001b = u) in raritete (001a = r), • zapise, označene za brisanje (001a = d), prve vnose zapisov (001a = i) in predhodne (CIP) zapise (001a = p), • stare zapise z napačnim bibliografskim nivojem (001c = e), zapise s staro hierarhijo (maska M2) in zapise na gornjem nivoju hierarhično obdelanih zapisov s staro hierarhijo (povezane preko polj 461, 462 in 463), • zapise, prevzete iz baze podatkov ISSN [12], • zapise za neknjižno gradivo. Na ta način se v WorldCat niso prenesli zapisi, ki ne ustrezajo strukturi formata MARC 21, niso popolni, bodo izbrisani iz vzajemne bibliografske baze, niso bili popravljeni po ukinitvi stare hierarhije ali so bili prevzeti iz baze podatkov ISSN in se zaradi licenčnih pogojev ne smejo distribuirati. Iz inicialnega prenosa smo izločili tudi zapise za neknjižno gradivo, ker je konverzija le-teh v format MARC 21 zelo kompleksna. Skupaj je tako bilo iz prenosa izločenih 385.263 zapisov. Gordana Budimir: BIBLIOGRAFSKI ZAPISI IZ COBIB.SI V WORLDCAT

RkJQdWJsaXNoZXIy MTAxMzI5