OZ 2009/4

M T 197 ORGANIZACIJA ZNANJA 2009, LETN. 14, ZV. 4 Vsaka konvertirana baza podatkov je bila testirana najprej v IZUM-u, nato pa še v Bolgariji. Pri testiranju smo preverjali: • kako popolni so preneseni podatki, • ali so pravilno razčlenjeni in uvrščeni znotraj formatov COMARC, • ali so pravilno združeni znotraj formatov COMARC, • ali so pravilno programsko dodani, • ali so besedila pravilno pretvorjena v kodirane podatke, • ali so maske vnosa pravilno izbrane, • kako je oblikovano sistemsko polje, • ali so kombinacije podatkov glede na programske kontrole pravilne in • ali so podatki preneseni v ustrezni nabor znakov COBISS. Slika 7 prikazuje število iteracij testiranja za posamezno bibliografsko in normativno bazo podatkov. Večino baz smo testirali v treh različnih iteracijah. Slika 7: Število iteracij v postopku testiranja Na koncu smo popravke in dopolnitve upoštevali in vključili v postopek konverzije. Težave pri konverziji Pri konvertiranju bibliografskih baz podatkov Nacionalne knjižnice Bolgarije smo se soočili s precejšnim številom težav, ki so se pojavile zaradi: • Razlik pri definiranju ponovljivosti polj . V formatu ISIS ponovljivost polj in podpolj ni natančno definirana, saj obstajajo tudi polja, ki so hkrati ponovljiva in neponovljiva. • Razlik v predstavitvi intelektualne odgovornosti. V formatu ISIS namreč obstajajo le tri polja za vnos imen – osebnih in korporativnih. V ta polja so bile vnesene: • enotne značnice primarne odgovornosti za osebna imena in korporacije; • enotne značnice alternativne in sekundarne odgovornosti za osebna imena, enotne značnice osebnih imen kot predmetne oznake ter variantne oblike vseh omenjenih enotnih značnic; • enotne značnice alternativne in sekundarne odgovornosti za korporacije ter njihove variantne oblike. Tudi struktura značnic bistveno odstopa od standarda. V bolgarskih zapisih polja za značnice nimajo podpolj, s katerimi bi bilo mogoče identificirati dele značnice. Zato je bilo treba z različnimi manipulacijami iz 3 polj s 6 podpolji ustvariti 16 polj s skupaj 67 podpolji. • Nestandardnih vsebin podatkov. Zaradi nestandardnih vsebin podatkov za registre tiskarjev in založnikov v Nacionalni bibliografiji smo morali pri konverziji dveh popolnoma nestandardnih polj, za katere ustrezne utemeljitve polj ni bilo mogoče najti niti v standardih ISBD, določiti novo polje na lokalnem nivoju. • Odsotnosti kodiranih podatkov . Bolgarski zapisi ne vsebujejo kodiranih podatkov, z izjemo kode za vrsto dokumenta, zaradi česar smo razlike v zvezi s kodiranimi podatki rešili s pripravo tabel za pretvorbo prostega besedila v kodirane podatke. • Sistemskih napak. V času konverzije smo posegali tudi v besedilne podatke in popravili sistematsko ustvarjene napake, da bi v določeni meri prilagodili besedilo izpisnim pravilom v bolgarskem sistemu. • Neenotne uporabe katalogizacijskih pravil. Težave nam je povzročilpredvsem neenoten način vnosa podatkov variantnih značnic v različnih časovnih obdobjih. V bazi bolgarskih monografij sta obstajala za isti postopek dva načina vnosa in s tem tudi dva različna algoritma. Po natančni analizi velikega števila zapisov smo se odločili za algoritem, ki je zajel večinski delež števila zapisov. Zapise, ki se niso pravilno konvertirali, bo treba popraviti ročno po zaključeni konverziji. Konvertirani bibliografski zapisi V lokalno in vzajemno bazo podatkov je bilo konvertiranih skupaj 740.514 bibliografskih zapisov. Glede na tip gradiva je bilo med njimi 50 odstotkov zapisov za monografske publikacije, 46 odstotkov zapisov za članke in 4 odstotki zapisov za kontinuirane vire (slika 8).

RkJQdWJsaXNoZXIy MTAxMzI5