OZ 2007/4

214 ORGANIZACIJA ZNANJA 2007, LETN. 12, ZV. 4 javijo na opisovani enoti, jezike povzetkov in predmetnih oznak, jezike tablic za klasifikacijo, jezike nekaterih na- slovov itd. Večinoma so ti podatki kodirani, ni pa nujno. Podobno delamo v normativnih zapisih, le da je v njih teh podatkov manj. Tu zaenkrat vpisujemo jezik in pisavo katalogizacije, jezik avtorja, jezik korporacije in jezik variantne značnice. KODIRANI PODATKI O JEZIKU ISO 639-2 V zapisih je večina podatkov o jeziku kodiranih. Za normativne in bibliografske zapise se uporablja isti šif- rant. Format UNIMARC, na katerem temelji tudi format COMARC, za kodiranje jezika predpisuje uporabo stan- darda ISO 639-2 Codes for the representation of names of languages. Part 2, alpha-3 code. Standard je nastal leta 1998 na osnovi šifranta MARC code list for languages , ki ga vzdržuje Kongresna knjižni- ca. Ta je pooblaščena za zbiranje in obravnavo predlogov za nove kode in tudi za standard ISO 639-2. Za bibliografsko kontrolo se uporabljajo tiste kode iz standarda, ki so okrajšane iz angleških izrazov. Kode za srbski, hrva{ki in bosanski jezik V šifrantih, ki jih uporabljamo v sistemu COBISS, je žal prišlo do sprememb ravno pri kodah za nekatere jezike, ki se uporabljajo na območju bivše Jugoslavije. Gre za srb- ski, hrvaški in bosanski jezik. Standard ISO 639-2 trenut- no za te jezike predpisuje kode “bos” – bosanski , “scr” – hrvaški in “scc” – srbski. Dokler smo imeli v bivši državi skupen sistem, smo za te jezike uporabljali kodi “scr” – srbohrvaški (latinica) in “scc” – srbohrvaški (cirilica) . Leta 1991 smo v IZUM-u od knjižnic prejeli zahtevo za ločeno kodo za hrvaški je- zik in tako je bila v šifrant dodana koda “cro” – hrvaški . Nato je bila leta 2000 v skladu s standardom dodana še koda za bosanski jezik “bos” – bosanski . Poleg tega so po ločitvi skupnega sistema v več sistemov COBISS v nekaterih državah začeli uporabljati različna pojasnila h kodam “scr” in “scc”: v enih državah je pome- nilo “scr” – srbski (latinica) in “scc” – srbski (cirilica), v drugih državah pa so uporabljali kodi “ scr” – srbski ali hrvaški (latinica) , “scc” – srbski ali hrvaški (cirilica) . Težav je bilo torej več. Šifrant za jezike, ki ga uporablja- mo v sistemu COBISS, ni bil skladen s standardom, po- vrhu pa se je v različnih državah uporabljal različno. Do razlik je prihajalo ravno pri jezikih, v katerih je napisan velik delež gradiva, ki ga imajo knjižnice s tega območja. Zato smo v IZUM-u predlagali, da kode za jezike v siste- mih COBISS poenotimo s standardom. PROJEKT POENOTENJE UPORABE KOD ZA JEZIKE IN PISAVE V COBISS.NET Č asovni pregled Projekt smo prvič uvrstili v letni program dejavnosti IZUM-a leta 2005. V resnici pa se je delo na projektu začelo že v letu prej. Takrat smo pripravili prvo speci- fikacijo sprememb v bibliografskih bazah in dopolnitev programske opreme. Oktobra 2004 smo predlagane spremembe opisali in dopis naslovili na nacionalne knjižnice. Le-te so se s predlogom strinjale, zato smo decembra 2004 o načrtovanih spremembah obvestili še vse knjižnice, ki sodelujejo v slovenskem sistemu COBISS.SI . V obdobju 2005–2007 je potekalo načrtovanje nove ver- zije programske opreme. V začetku junija leta 2007 smo razvoj zaključili do te mere, da smo nekatere segmente lahko ponudili knjižnicam v testiranje. Testiranje je bilo relevantno predvsem za države, v katerih uporabljajo ciri- lico. Tem smo testiranje najavili že aprila 2007, kot rok za oddajo pripomb pa smo postavili konec avgusta. Oktobra 2007 smo v vseh sistemih, razen v slovenskem, testirali še uporabniški vmesnik COBISS/OPAC. Ob koncu tedna, 3. in 4. novembra 2007, smo izvedli konverzijo vseh bibliografskih baz podatkov in namestili novo verzijo programske opreme. Naloge projekta Pred uskladitvijo pomena kod “scr” in “scc” s standar- dom ISO 639-2 je bila informacija o pisavi skrita kar v kodi za jezik. S kodo “scr” smo namreč označevali le besedila v latinici, s kodo “scc” pa le besedila v cirilici. Programska oprema je bila zasnovana tako, da je bil v nekaterih primerih podatek o jeziku bistven za krmiljenje pisave prikaza. Z načrtovano spremembo to ni bilo več res. V skladu s standardom ISO 639-2 se koda “scc” uporablja za srbski jezik, ne glede na to, ali je besedilo pisano v cirilici ali la- tinici. Zato smo morali poleg drugih dopolnitev program- ske opreme in konverzije pripraviti tudi nov algoritem za krmiljenje pisave. Naloge, ki jih je bilo v okviru projekta Poenotenje upo- rabe kod za jezike in pisave v COBISS.Net treba opraviti, smo razdelili v pet večjih sklopov:

RkJQdWJsaXNoZXIy MTAxMzI5