OZ 2010/4

M T 147 ORGANIZACIJA ZNANJA 2010, LETN. 15, ZV. 4 Slika 4: Statistika napak v zapisih po vsebinskih kontrolah Zapisi so imeli naslednje napake: • napačna dolžina podpolja – 100c (546 zapisov), 100d (26 zapisov), 101a (16 zapisov), 105a (883 zapisov), 115b (1 zapis), skupaj 1.472 zapisov, • napačna letnica v podpolju 100c (289 zapisov), • v podpolju 115b podatek ni številka, • če je v podpolju 001c koda "d", mora biti v podpolju 001b koda "u" (671 zapisov), • če je v podpolju 135b koda "h" ali "j", mora biti v podpolju 001b koda "l" ali "m", • koda v podpolju 106a je lahko samo "d", "e", "f", "g" ali "h", • če je v podpolju 001c koda "d", v zapisu ne sme biti podpolja 115a, 116a, 124b in 135b, • za članke v serijskih publikacijah v podpolju 001b ne sme biti kode "b", "d" ali "f" (9 zapisov), • vrednosti prvega in drugega indikatorja v poljih so lahko številke ali presledek (85 zapisov), • polje 135 mora vsebovati vsaj eno podpolje a ali b, • polja 115, 116, 126 in130 morajo vsebovati podpolje a, • polje 124 mora vsebovati podpolje b, • če zapis vsebuje polje 130, mora biti koda v podpolju 001b "a" ali "b", • če je v podpolju 106a koda "g", mora v zapisu obstajati polje 130, • koda "c" ne more biti hkrati v podpoljih 124a in 124b, • če je v podpolju 115a koda "a", v podpolju 115g ne sme biti kode "g", "h", "i", "j", "k" in "l" in polje 115 ne more vsebovati podpolja k ali l, • če je v podpolju 115a koda "b", v podpolju 115g ne sme biti kode "a", "b", "c" ali "d". S temi kontrolami vsebine je bilo tako izločenih 2.526 zapisov. Iz seznama je razvidno, da z večino kontrol program ni našel napačnih zapisov. To je zaradi tega, ker so te kontrole namenjene zapisom za neknjižno gradivo, ki v inicialnem prenosu zapisov v bazo podatkov WorldCat ni vključeno, bo pa vključeno v prihodnjih četrtletnih prenosih zapisov po končanem vključevanju zapisov iz inicialnega prenosa. Največ zapisov je bilo izločenih zaradi napačne dolžine vsebine posameznih podpolj ali zaradi napačnih kod v določenih podpoljih. Med njimi izstopajo zapisi z napačnimi kodami v podpolju 105a ( Kode za ilustracijo ). Kode in njihova dolžina se je v formatu COMARC/B spremenila, konverzija teh kod pa za obstoječe zapise ni bila narejena. Veliko zapisov ima tudi napačno dolžino ali vsebino v podpolju 100c, ki na primer vsebuje letnice v oklepajih ([],<>), letnice s pomišljaji, sestavljene letnice ali okrajšave (npr. "s.a.", "s.n.", "b.l."). Največ teh napak je nastalo pri konverzijah zapisov iz drugih sistemov v sistem COBISS. INICIALNI PRENOS ZAPISOV Z izločitvijo neustreznih in nekakovostnih zapisov glede na opisane kriterije je bilo za inicialni prenos zapisov iz vzajemne bibliografske baze podatkov COBIB.SI dne 31. 8. 2009 pripravljenih 3.129.559 zapisov s 4.309.076 podatkov o zalogi. Ker se bibliografski zapisi, vključeni v WorldCat, ne ažurirajo, pač pa se ažurirajo samo podatki o zalogi, smo zapise v formatu COMARC/B skupaj s kodami knjižnic, ki imajo zalogo, shranili v posebno bazo prenesenih zapisov. Pri ažuriranju podatkov o zalogi bo tako v OCLC vedno poslan enak bibliografski zapis, kakršen je bil v času vključevanja. Zapise iz baze prenesenih zapisov smo nato konvertirali v format MARC 21 in pripravili paket 35 datotek (vsaka z največ 90.000 zapisi) po standardu ISO 2709 [14], ki smo jih 4. 9. 2009 prenesli na strežnik OCLC v okviru njihovega servisa za izmenjavo zapisov EDX ( Electronic Data Exchange ) [15] preko protokola FTP ( File Transfer Protocol ). Prenesene zapise so v OCLC preverili po standardu ISO 2709 in nam vrnili 5 neustreznih zapisov. Ugotovljeno je bilo, da je struktura teh zapisov neustrezna zaradi predolgih polj 327 in 330. Ker je dolžina polja po standardu ISO 2709 največ 9999 znakov, v formatu COMARC/B pa takšnih omejitev ni, se bodo v prihodnje predolga podpolja izločila iz zapisa pred konverzijo v format MARC 21. Nato je v OCLC stekel postopek iskanja parov med poslanimi zapisi iz vzajemne bibliografske baze COBIB.SI in zapisi v bazi podatkov WorldCat. Cilj tega postopka je, da se v bazi WorldCat ne kreirajo podvojeni zapisi, pač pa da se podatki o zalogi knjižnic dodajo že Gordana Budimir: BIBLIOGRAFSKI ZAPISI IZ COBIB.SI V WORLDCAT

RkJQdWJsaXNoZXIy MTAxMzI5