Lekcija 6
Bulova logika pretrazivanja
Jednostavno receno, Bulova logika nam omogucava da suzimo ili prosirimo pretrazivanje tako sto termine medjusobno povezujemo na veoma precizan nacin. Njen veliki znacaj je u tome sto nam omogucava da upite za pretrazivanje ucinimo jedinstvenijim i tako efikasnije pretrazujemo. Tvorac ove logike je Dzordz Bul, engleski matematicar iz 19. veka, a ona se danas na Webu koristi u svom najjednostavnijem obliku, tj. koriste se sledeca cetiri operatora:
- AND (I)
- OR (ILI)
- NOT (NE)
- NEAR (BLIZU)
Ovi termini su sami po sebi jasni.
AND omogucava prisustvo vise od jednog termina za pretrazivanje.
Pitanje: Nadji sve strane koje sadrze i rijec drew i rijec sullivan
Odgovor: drew AND sullivan
OR omogucava navodjenje vise termina za pretrazivanje od kojih jedan mora biti prisutan u rezultatu
Pitanje: Nadji sve web strane o stampanim medijima
Odgovor: novine OR casopisi OR nedjeljnici
NOT omogucava pretrazivanje nekih termina, ali bez nekih drugih (koje zelimo da iskljucimo)
Pitanje: Nadji sve strane o Sarajevu, ali ne i o opsadi grada
Odgovor: Sarajevo NOT opsada
NEAR vam omogucava da nadjete odredjeni termin u blizini nekog drugog termina
Pitanje: Nadji sve strane o djeci koja su prinudjena da rade
Odgovor: dijete NEAR prinudni rad
Sve bi bilo lako da svaka od masina koristi operatore bas ovako kako smo ih naveli. Medjutim, cesto se umesto AND koristi znak +, umesto NOT koristi se - , a neke masine jednostavno ne mogu da koriste operator NEAR (ovaj operator je "specijalnost" masine www.altavista.com). Zato je vazno da kada prvi put koristite neku masinu potrosite nekoliko minuta na citanje uputstava za pretragu koja ce vam ustedeti puno vremena jer necete nasumice ukucavati operatore koje data masina ne razume.
Bolova logika pretrazivanja vam cesto omogucava da pretrazujete koristeci nizove karaktera. Da biste oznacili jedan takav niz, stavite cijelu frazu u znake navoda. Ako trazite neku osobu na Webu, mogli biste pokusati ovako:
"Harry S. Truman"
Recimo da nas zanima nesto o nasem poznaniku koji se zove Drew Sullivan. Posto ima na milione strana i na stotine ljudi sa tim imenom, moracemo da preicziramo pretrazivanje da bismo nasli bas onog Drew Sullivana koji nas zanima. Mogli bismo da pocnemo sa najopstijim pretrazivanjem, a zatim mozemo polako da suzavamo pretrazivanje dok ne dobijemo broj rezultata koji se da pregledati za relativno kratko vrijeme. U suprotnom bismo dobijene web strane pregledali satima.
Evo rezultata koje smo, koristeci navedene nacine za suzavanje pretrazivanja, dobili uz pomoc masine za pretrazivanje Google (tj. njenog dijela koji koristi Bulovu logiku). Iz rezultata pretrazivanja saznajemo da postoji jos jedan Drew Sullivan, koji zivi u Kanadi, i radi sa operativnim sistemima Linux. On nije osoba koju trazimo, pa da bismo suzili pretrazivanje, koristimo posljednji primjer iz tabele.
| upit za pretrazivanje | broj pronadjenih strana |
| drew OR sullivan | 2.960.000 |
| drew +sullivan | 187.000 |
| "drew sullivan" | 1.090 |
| "drew sullivan" -linux |
741 |
Rezultate pretrazivanja smo sveli na 741 web strana, ali je kod precizne pretrage uobicajeno da se broj dobijenih strana svede na manje od 100, ili cak manje od 50 prije pregledanja. Razlog je taj sto pregledanje dobijenih strana moze biti spor i naporan proces, u zavisnosti od brzine veze kojom raspolazete. Dalje suzavanje upita postizemo kombinovanjem Bulovih operatora.
Kombinovanje Bulovih operatora u pretrazivanju
"Moc" ovih termina se moze kontrolisati kada ih kombinujete medjusobno.
Na primjer, ovo pretrazivanje cemo dalje suziti tako sto cemo frazi "drew sullivan" dodati i rec journalist (novinar), i tako dobijamo:
"drew sullivan" +journalist
Medjutim, Drew Sullivan se na sajtovima pomine i kao novinar i kao reporter. Treba da dodamo i rijec reporter.
"drew sullivan" +journalist +reporter
ili
"drew sullivan" journalist reporter
(u Googlu plusevi nisu neophodni, rijec se automatski dodaje upitu)
| upit za pretrazivanje | broj pronadjenih strana |
| "drew sullivan" journalist |
95 |
| "drew sullivan" reporter | 109 |
| "drew sullivan" reporter OR journalist | 143 |
U gore navedenom primjeru smo htjeli da dobijemo termin "drew sullivan" i bilo koji od termina reporter i journalist (reporter or journalist). Dobijamo 143 pogodaka, sto smo i mogli ocekivati, jer prosirenjem upita za pretrazivanje treba da dobijemo nesto vise pogodaka od prethodno dobijenih 109. Pracenje broja pogodaka je vazno jer vam omogucava da provjerite sopstveni rad i da se uvjerite da li je upit koji koristite bas onaj koji vam i treba.
Evo jos jednog upita koji mozete da upotrebite u Googlu ako znate gdje je Drew Sullivan radio:
"drew sullivan" reporter OR journalist "associated press" OR AP OR Tennessean
| strane sa "drew sullivan" | 1.090 |
| strane sa (reporter or journalist) | 1.740.000 |
| strane sa ("associated press" or AP or Tennessean) | 512.000 |
| strane sa sva tri elementa upita | 77 |
Napredne opcije za pretrazivanje
Kada odete na prvu web stranu bilo koje od masina za pretrazivanje, primjeticete da cete uvijek dobiti okvir za pretrazivanje nalik onome na polaznoj stranici Googla. Medjutim, svaka od masina ima i opciju za napredno pretrazivanje koju cete naci pod "advanced search" (napredno pretrazivanje) ili "power search". Dobro je poznavati ove napredne opcije jer cesto imaju dodatne mogucnosti suzavanja i preciznog definisanja pretrage - recimo, mozete birati da kao rezultat dobijate stranice samo na jednom jeziku. Sa naprednim pretrazivanjem u Googlu i AllTheWeb-u detaljnije cemo se upoznati u narednim lekcijama.
Velika slova
Najpoznatije masine za pretrazivanje ne prave razliku izmedju malih i velikih slova. U Googlu, recimo, mozete ukucati SARAJEVO, sarajevo ili SaRaJeVo i dobicete iste rezultate.
Ostale masine za pretrazivanje:
Pored Googla, koji je postoje i druge mocne masine za pretrazivanje po kljucnoj rijeci. Svaka je u necemu bolja od drugih, a kriterijuma za njihovo poredjenje ima mnogo. Google i AlltheWeb imaju ubedljivo najveci indeks stranica - preko dve milijarde, a i najmocnije opcije za napredno pretrazivanje koje danas postoje, ali mozda nemaju ono sto vam treba u datom trenutku. Roboti razlicitih masina prikupljaju razlicite stranice, i drugacije ih rangiraju kada dobijete rezultate pretrage. Ako neku stranicu ne mozete naci u jednoj od " najvecih" masina, sasvim je moguce da cete je naci u nekoj "manjoj". Dakle, ako koristite samo jednu masinu sve vrijeme, to vam je kao da trazite izgubljene kljuceve samo tamo gdje dopire svjetlost lampe. Dobri pretrazivaci su upoznati sa svim dobrim masinama za pretrazivanje. Evo jos nekih.
- Alta Vista http://www.altavista.com/
- Hotbot: http://hotbot.lycos.com/
- Lycos: http://www.lycos.com/
Postoji veliki broj sajtova koji vam pomaze da se snadjete u svijetu masina za pretrazivanje. Dobro ih je povremeno pregledati jer se masine i opcije koje nude mijenjaju velikom brzinom, a ovi sajtovi budno prate svaku promjenu te vrste. Jedan od njih je i Search Engine Watch, onlajn magazin o masinama za pretrazivanje i odlican izvor detaljnih informacija o njima. Ukljucuje uporedni pregled opcija za pretrazivanje kojima raspolazu razne masine, kao i korsnih strategija i tehnika za pretrazivanje.
Drugi izvori
Evo jos nekih izvora informacija o Bulovoj logici i masinama za pretrazivanje.
- Uputstva za pretragu u Googlu
- Uputstva za pretragu u AllTheWebu
- Bukvar Bulove logike Univerziteta u Albaniju
- Bulova strana Search Engine Watch-a
All material Copyright © 2000 Drew Sullivan
unless otherwise indicated.
All Rights
Reserved