OZ 2013/1-4

42 ORGANIZACIJA ZNANJA 2013, LETN. 18, ZV. 1 – 4 UVOD Lucene/Solr Revolution je največja odprtokodna konferenca, posvečena Apachejevemu projektu Lucene/ Solr. Konferenco je organiziralo podjetje LucidWorks, ki zaposluje dobro četrtino vseh razvijalcev projekta Lucene/ Solr in tudi zagotavlja podporo za omenjena projekta. Konferenca je potekala od 4. do 7. novembra v Dublinu, glavnem mestu Irske, ki je tudi ekonomsko, administrativno in kulturno središče otoka. Leži na vzhodni obali ob izlivu reke Liffey v Irsko morje. Mesto, ki si ga ustanovili Vikingi, ima danes okoli pol milijona prebivalcev. Konferenca je potekala v mestni četrti Ballsbridge, poimenovani po mostu preko reke Dodder, in sicer na nacionalnem stadionu, kjer igrata irski izbrani vrsti nogomet in ragbi. Konferenca je potekala v dveh delih: prvi je trajal dva dneva in je bil namenjen praktičnemu tečaju, v drugem delu pa so potekala predavanja. KAJ JE SPLOH LUCENE/SOLR Apache Lucene je odprtokodni zmogljiv iskalnik, napisan v celoti v jeziku Java, z naslednjimi lastnostmi: • dostop preko enostavnega API-ja, • hitro indeksiranje, • nizke strojne zahteve, • zmogljivi, natančni ter učinkoviti iskalni algoritmi, • rangirano iskanje, • različne vrste iskanja (frazno iskanje, iskanje s krajšanjem, iskanje po območju, iskanje z bližino …), • razvrščanje rezultatov, • fasetiranje, grupiranje. Apache Solr je iskalna platforma nad Lucenom. Glavne lastnosti so: polno iskanje po besedilih, označevanje zadetkov, fasetno iskanje, indeksiranje skoraj v realnem času, integracija podatkovne baze, rokovanje z dokumenti (word, PDF) in geoprostorsko iskanje. Solr je zelo zanesljiv, nadgradljiv ter toleranten na napake. Omogoča porazdeljeno indeksiranje, podvajanje strežnikov ter izenačevanje obremenitve pri iskanjih. Do Solr-ja je mogoče dostopati preko http/xml in programskih vmesnikov JSON. PRAKTI^NO USPOSABLJANJE Praktično usposabljanje je potekalo v treh različnih tečajih, ki so potekali istočasno: Solr Unleashed, Solr Under the Hood in Big Data & Solr. Udeležil sem se tečaja Solr Unleashed. Big Data & Solr je bil namenjen razvijalcem, ki želijo: • vedeti več o ključnih odprtokodnih orodjih, kot so Hadoop, Cascading in Mahout, • procesirati masivne podatke in generirati velike iskalne indekse, • uporabljati Solr kot nadgradljivo bazo NoSQL. Solr Under the Hood je bil namenjen vsem, ki Solr že poznajo, a želijo vedeti, kako le-ta deluje in kako maksimalno izkoristiti njegovo zmogljivost. Solr Unleashed Na začetnem tečaju so predstavili vse pomembne funkcije Solr in odgovorili na vsa vprašanja, ki se pojavijo pri razvoju iskalnika; recimo, kaj je treba spremeniti, da bi lahko bolje izkoristili zmogljivosti Solr. Tečaj sestavlja 8 logičnih sklopov in 25 praktičnih nalog. 1. Osnove Prikazali so nametitev Solr, dodajanje vsebine v Solr in osnovno iskanje. Iščemo lahko preko URLAPI-ja (primer: http://localhost :8983/solr/select/?q=Cankar) ali pa preko vmesnika za brskanje, ki je običajno namenjen testiranju in se ne uporablja v produkciji. 2. Iskanje Prikazali so sortiranje rezultatov, različne razčlenjevalnike poizvedb (angl. query parsers ), fiksiranje parametrov iskanja, fasetno iskanje in grupiranje rezultatov iskanja. Konferenca Lucene/Solr Revolution 2013 doi:10.3359/oz1314042 1.25: DRUGI ČLANKI ALI SESTAVKI

RkJQdWJsaXNoZXIy MTAxMzI5