OZ 2010/4

148 ORGANIZACIJA ZNANJA 2010, LETN. 15, ZV. 4 obstoječim zapisom, če je le možno. Algoritem iskanja ustreznega zapisa v podatkovni bazi WorldCat poteka v štirih korakih. 1. Iskanje preko identifikatorjev: • OCLC iz podpolja 035a, • LCCN iz podpolja 010a, • ISBN iz podpolja 020az, • ISSN iz podpolja 022a, • CODEN iz podpolja 030a, • URL iz podpolja 856u, • številke založnika iz podpolja 028a in 262c ali • kakšne druge identifikacijske številke iz podpolj 016a, 024a, 027a, 088a, ali 029a. 2. Če v prvi fazi program ni našel ustreznega zapisa, se upoštevajo podatki o: • avtorjih iz podpolj 100a, 110ab, 130a, 700a, 710ab, 711a, 730a in 720a, • naslovu iz podpolj 245akbfnp, • založniku iz podpolj 533c, 260bf, 261abe in 262b, • letu izida iz polja 008 ali • vrsti gradiva. 3. Če je program našel več ustreznih zapisov za povezovanje, je treba dodatno preveriti njihovo ustreznost na osnovi podatkov o: • jeziku katalogizacije iz podpolja 040b, • letu izdaje iz podpolj 260c, 553d in 362a, • naslovih v poljih 246 in 247 in • fizični obliki. 4. Določanje najbolj ustreznega zapisa s točkovanjem od 1 do 15 na osnovi dodatnih internih kriterijev v OCLC. Pred iskanjem parov med zapisi se posamezni podatki normalizirajo po določenih pravilih (npr. brisanje interpunkcij, pretvorba v male črke itn.). Če z algoritmom za iskanje parov program ne najde nobenega ustreznega zapisa, se prenesen zapis vključi v bazo podatkov WorldCat kot originalni zapis knjižnice oz. institucije, ki je zapis poslala. Tako 3.063.840 zapisov, ki so bili preneseni iz vzajemne bibliografske baze COBIB.SI z inicialnim prenosom, predstavlja originalne zapise v WorldCatu. Program je našel tudi 36.269 ustreznih zapisov, ki so jim dodani samo podatki o zalogi. Razlog za tako veliko število originalnih zapisov je jezik katalogizacije (slovenski), ki je eden od kriterijev za določanje podvojenih zapisov v podatkovni bazi WorldCat. Na ta način je bilo z inicialnim prenosom v WorldCat vključenih 3.100.109 zapisov. Preostalih 29.445 zapisov je nerazrešenih in čakajo na nadaljnjo obdelavo. V OCLC bodo te zapise najprej poskušali programsko obdelati glede na napake, ki so jih ugotovili pri vključevanju v bazo podatkov. Zapise, ki niti po programski odpravi napak ne bodo vključeni, OCLC pošlje knjižnicam ali drugim institucijam skupaj z opisom napak, ki naj bodo odpravljene pred ponovnim pošiljanjem zapisov v OCLC. OCLC pripravi za vključene zapise tabele preslikav med identifikatorji zapisov OCLC-ID in COBIB.SI- ID (tako imenovane tabele XREF), kar omogoča sinhronizacijo baze prenesenih zapisov v IZUM-u z bazo podatkov WorldCat. V vsak vključen zapis IZUM doda podpolje 035a z identifikatorjem OCLC-ID, ki pri ažuriranju zaloge zapisov omogoča enoznačno povezovanje zapisov iz vzajemne bibliografske baze COBIB.SI z ustreznimi zapisi v podatkovni bazi WorldCat. Na ta način se onemogoči kreiranje podvojenih zapisov v bazi WorldCat. ^ETRTLETNI PRENOSI ZAPISOV Po končanem inicialnem prenosu se bodo zapisi iz vzajemne biliografske baze podatkov COBIB.SI prenašali v bazo podatkov WorldCat četrtletno (vsake 3 mesece). S tem bo v bazi podatkov WorldCat omogočeno ažuriranje podatkov o zalogi knjižnic pri že vključenih zapisih in vključevanje novih zapisov iz vzajemne baze COBIB.SI. Ker OCLC še ni končal postopka inicialnega vključevanja zapisov v bazo podatkov WorldCat (počakati je treba na poročilo o napakah v nevključenih zapisih), smo se v IZUM odločili, da do takrat v OCLC ne pošiljamo novih zapisov, pač pa samo ažuriramo podatke o zalogi že vključenih zapisov. Načeloma se bibliografski zapisi iz podatkovne baze WorldCat ne brišejo. Zato se za zapise, ki so brisani iz vzajemne baze COBIB.SI in so vključeni v bazo podatkov WorldCat, pobrišejo samo podatki o stanju zaloge skupaj s kodo SILIS za sistem COBISS.SI. Podatki o stanju zaloge se ažurirajo tako, da se v OCLC prenesejo skupaj z bibliografskim zapisom, ki je bil poslan v OCLC ob vključitvi le-tega v bazo podatkov WorldCat. Natančneje, pošlje se en zapis s kodami knjižnic, ki nimajo več zaloge, in še dodaten zapis s kodami knjižnic, ki so v tem času pridobile zalogo. Razlika v teh dveh bibliografskih zapisih je samo v statusu zapisa v podpolju 001a: " d" – zapis s kodami za brisanje, "n" – zapis z dodanimi kodami . Novi zapisi, ki se bodo prenašali v bazo podatkov WorldCat, se bodo pripravljali na enak način kot v postopku inicialnega prenosa. Pred prenosom bo program s prej opisanimi kontrolami preveril zapise v formatu COMARC/B in izločil neustrezne in nekakovostne zapise. Skupaj z zapisi, ki so pripravljeni za ažuriranje podatkov o zalogi, se bodo nato konvertirali v format MARC 21. Zapisi, ki bodo ustrezali strukturi formata MARC 21, bodo preneseni na strežnik OCLC in uvrščeni v vrsto za vključevanje v bazo podatkov WorldCat. Rok za obdelavo Gordana Budimir: BIBLIOGRAFSKI ZAPISI IZ COBIB.SI V WORLDCAT

RkJQdWJsaXNoZXIy MTAxMzI5