Lekcija 8

Sada znamo kako da koristimo katalosku masinu za pretrazivanje (kao sto je Yahoo), i masinu za pretrazivanje po kljucnoj rijeci (kao sto je Google) uz pomoc Bulove logike i pretrazivanja po kljucnoj rijeci.

Ali koju masinu treba da koristimo? Pa, to zavisi od onoga sto trazimo. Ako zakucavate ekser, treba vam cekic, a ne srafciger.

Dakle, treba da utvrdimo strategiju kojom cemo "napasti" odredjeni problem. Kao sto smo vec rekli, pretrazivanje je umjetnost, a ne nauka. Govoricemo o opstoj strategiji pretrazivanja koju mozete primjeniti na vecinu vasih pretrazivanja. Ona podrazumijeva i nekoliko koraka koji vam pomazu da odredite odakle da pocnete. Ali zapamtite - Web je haos, tako da i najbolji plan za pretrazivanje nekad ne da zeljene rezultate, a glup plan se posreci. Ipak, sreca je posljedica namjere, pa cete uz dobro razradjenu strategiju pretrazivanja daleko cesce imati "srece".

U lekciji 3 smo govorili o opstem pristupu. Da se podsjetimo.

  1. Vec znamo gdje cemo naci trazene informacije
  2. Ispravno pogadjamo gdje su informacije (nemojte se smijati)
  3. Kataloske masine za pretrazivanje (vidjeti lekciju 4)
  4. Masine za pretrazivanje po kljucnoj rijeci (vidjeti lekciju 5 i lekciju 6)
  5. Specijalizovane masine za pretrazivanje

Ukoliko ste na prva dva pitanja odgovorili odricno, treba da upotrebite neku od masina za pretrazivanje. Sada ostaje da razmislite da li cete upotrijebiti katalosku masinu za pretrazivanje/direktorij ili masinu za pretrazivanje po kljucnoj rijeci. Umjesto da malo razmisli, vecina ljudi bi vec otisla u Google, ukucala "Bil Clinton", dobila 1,9 miliona rezultata i rekla "u vrazju mater ovaj internet". I ja sam to radio. Bolji pristup je logicno razmisljanje.

Prvo uzmite u obzir katalosku masinu za pretrazivanje/direktorij. Najlaksa je za koristenje. Yahoo je cesto od velike pomoci, ali se kod ozbiljnog pretrazivanja obicno ne koristi sav njegov potencijal.

Kataloske masine za pretrazivanje kao sto je Yahoo dobro se ponasaju u sljedecim situacijama:

  1. Kada trazite Web sajt
  2. Kada trazena informacija nije jedinstvena (slavna imena, poznate teme, organizacije)
  3. Kada niste sigurni sta zapravo trazite
  4. Kada trazite opste ili bekgraund informacije.

Masine za pretrazivanje po kljucnoj rijeci su najbolje:

  1. Kada trazite Web stranu
  2. Kada trazite jedinstvenu informaciju (npr. neuobicajena imena, e-mail adrese, naslove izvjestaja)
  3. Kada trazite nesto odredjeno.

Evo analogije koju smo vec pomenuli u lekciji 3, ali cemo je ponoviti jer je vazna. Kataloske masine su kao sadrzaj na poceku knjige. Uglavnom ce vas dovesti do polazne strane nekog web sajta (kao sto vas sadrzaj dovodi do prve strane odredjenog poglavlja knjige). Ako pokusavate da nadjete web sajt neke organizacije, osobe, firme, agencije ili sajt koji je posvjecen nekoj siroj temi, kataloske masine su za to odlicne. Imajte na umu da ljudi koji sastavljaju kataloske masine daleko vise paznje obracaju na kvalitet sajtova koji ce se naci u njihovom katalogu nego na kvantitet. Najbolje je da prvo svratite u katalosku masinu ako trazite sajtove koji pokrivaju dobro poznate teme, organizacije, pojedince itd, tj. one sajtove za koje naprosto ocekujete da postoje na Webu.

Masine za pretrazivanje po kljucnoj rijeci su kao indeks na kraju knjige.Vode vas do odredjenih rijeci na pojedinacnim stranama. Ako trazite clanke tacno odredjenog novinara, neki izvjestaj, najvisu planinu u Bosni ili visinu Empire state building-a, masine za pretrazivanje po kljucnoj rijeci su bolje. Zapamtite - ove masine prikupljaju strane automatski i ne prave selekciju medju njima. Ne procjenjuju vrijednost sajtova, tako da cete kroz njih pronalaziti svakave bizarne sadrzaje.

Razmislite o onome sto trazite. Je li to nesto sto cete naci u sadrzaju knjige ili u indeksu na kraju knjige? Evo jos jednom najvaznijih pojmova:

kataloska masina/direktorij

sadrzaj pocetak knjige web sajt
masina za pretrazivanje po kljucnoj rijeci indeks kraj knjige web strana

Evo nekih tipicnih primjera:

Problem Rjesenje
Trazite Web sajt Ljekara bez granica Katalog
Trazite izvjestaj ciji naslov znate Kljucna rijec
Ne znate naslov izvjestaja, ali znate koja organizacija ga je objavila Katalog
Zelite da sto vise saznate o plemenu Dinka u Sudanu Katalog
Zelite da saznate koliki je uobicajen miraz zene iz plemena Dinka Kljucna rijec
Zanima vas vremenska prognoza u svijetu Katalog
Zelite da saznate nesto o Bilu Klintonu Katalog
Zanima vas nesto o majci Bila Klintona Kljucna rijec

Posljednja strategija kojoj pribjegavam je da razmislim o tome ko bi mogao znati odgovor. Ako pokusavate da saznate koliki je prosjecni zivotni vijek u Sloveniji, to zvuci kao pretrazivanje po kljucnoj rijeci. Medjutim, to je teska pretraga. Postavite sebi pitanje koje sebi svakodnevno postavljate kao novinar: ko zna odgovor na ovo pitanje. Koja agencija ili organizacija prikuplja podatke o prosjecnom zivotnom vijeku? Jedna od organizacija koja to radi je Svjetska zdravstvena organizacija (WHO). Mogu li lako naci njen sajt u kataloskoj masini, a onda potraziti odgovor na sajtu? Jos bolje, mogu li da pogodim adresu sajta? Tacan pogodak bi bio i www.who.int ili www.who.org .

Uvijek je lakse korisiti katalosku masinu za pretrazivanje, pa cete, ako mozete da joj prilagodite upit, brzo moci da potrazite odgovor u okviru sajtova. Ako koristite masinu za pretrazivanje po kljucnoj rijeci, ogranicite se samo na web sajt na koji ste se namjerili. Na primjer, podatke o zivotnom vijeku mozemo traziti ovako:

site:www.who.int "life expectancy"bosnia slovenia

Uskoro cete vidjeti da su informacije dostupne u World Health Report na ovom sajtu, kojem se moze pristupiti sa Weba. 

I jos nesto na sta treba da obratite paznju. Bez obzira na to koliko web stranica svaka od masina za pretrazivanje indeksira, to je samo mali dio svih stranica koje postoje. Yahoo pokriva manje od 2% web stranica uopste (ali su to najposjecenije strane na webu - vise od polovine ukupnih posjeta webu zavrsava na tim stranama), a Google i AllTheWeb mogu da indeksiraju samo 15% postojecih stranica. Ima mnogo toga sto se ovim alatkama ne moze pronaci.

Puno je strana koje velike masine za pretrazivanje  ne mogu da indeksiraju. Evo nekih vrsta stranica koje necete naci masinom za pretrazivanje po kljucnoj rijeci.

Odviknite se od pogresnog pretrazivanja:

Vecina ljudi ne voli da se napreze pri pretrazivanju. Nemaju nikakvu strategiju pretrazivanja i 95% rezultata njihovih pretraga su smece. Ne vjerujete? Pogledajte Metracrawler's Metaspy, "kibicerski" sajt koji vam u realnom vremenu daju primjere upita po kojima ljudi pretrazuju. 

All material Copyright © 2000 Drew Sullivan unless otherwise indicated.
All Rights Reserved