Lekcija 5
Jedan od najmocnijih i najnepravilnije koristenih alata na internetu je masina za pretrazivanje po kljucnoj rijeci. Ona se razlikuje od kataloga koji ukljucuje intervenciju ljudi pri odabiru najboljih sajtova. Masina za pretrazivanje po kljucnoj rijeci podrazumijeva grublji pristup.
Ove masine ne ukljucuju rad ljudi, vec sajtove biraju automatski, pomocu programa koji se zovu web crvi ili roboti. Oni krstare Webom prateci linkove da bi nasli nove web strane. Robot indeksira svaku stranu i salje sve prikupljene informacije nazad, u glavni indeks. Kada pretrazujete koristeci masinu za pretrazivanje po kljucnoj rijeci, vi zapravo pretrazujete glavni indeks koji su sacinili web roboti.
Dok je Yahoo selektivan i u svoj indeks dodaje samo "najbolje" sajtove, masine za pretrazivanje po kljucnoj rijeci nisu selektivne i nastoje da indeksiraju sve na sta naidju. Yahoo raspolaze relativno malim brojem sajtova, ali su to istovremeno i najposjeceniji sajtovi na Webu. Google i AllTheWeb, dvije trenutno najpopularnije masine za pretrazivanje po kljucnoj rijeci, u svojim indeksima imaju mnogo opskurnih, malo posjecenih sajtova. Yahoo je donekle iskljuciv jer su ljudi ti koji odlucuju da li ce neki sajt uci u njegov indeks. Google (i ostale masine za pretrazivanje po kljucnoj rijeci) stranice prikupljaju automatski.
Posto razlicito funkcionisu, to znaci da ove "alatke" i korisimo na razlicite nacine. Evo jedne analogije koja vam moze pomoci da razumijete razliku izmedju masine za pretrazivanje po kljucnoj rijeci i kataloske masine: kataloska masina je slicna sadrzaju na pocetku knjige. U njemu su navedena poglavlja knjige, pa citalac pomocu sadrzaja moze da pretpostavi u kojem ce poglavlju naci trazene informacije. Masina za pretrazivanje po kljucnoj rijeci je slicna indeksu na kraju knjige u kojem trazimo termin koji nas zanima i odlazimo na stranu na kojoj se on nalazi.
Ne mozemo reci koja je od ove dve vrste masina efikasnija (tj. ne mozemo porediti recimo Yahoo i Google) jer ce se, u zavisnosti od prirode vaseg pretrazivanja, jedna od njih pokazati brzom od druge. Vecina ljudi, medjutim, uglavnom prvo pokusa sa masinom za pretrazivanje po kljucnoj rijeci. Ovaj pristup nije uvijek efikasan jer je internet slican knjizi sa milion poglavlja i vise milijardi strana.
Na primjer: zamislite internet kao biografiju Bila Klintona. Ako vas zanimaju bracna nevjerstva predsjednika Bila Klintona, necete u indeksu traziti termine "Klinton" ili "Luinski" jer biste tako nasli veliki broj konteksta u kojima se ove rijeci pojavljuju, a mnogi od njih bi se odnosili na dogadjaje kao sto je postupak za opoziv predsjednika, ili konsekvence njegovog nevjerstva, ali ne i ono sto zapravo trazite. Umjesto toga, snalazljiv istrazivac bi potrazio odgovarajuci naslov poglavlja. Isto je i na Internetu. Prvo potrazite poglavlje (katalog) prije nego sto odete u indeks (masina za pretrazivanje po kljucnoj rijeci).
Masine za pretrazivanje po kljucnoj rijeci su najbolje za:
- nalazenje jedinstvenih informacija
- nalazenje informacija koje nisu prisutne u obliku koji odgovara nasoj konkretnoj pretrazi
- nalazenje informacija koje se kriju u sklopu sire teme.
Ako trazite tacno odredjenu osobu, ali ne znate njeno zanimanje, firmu u kojoj radi, njene hobije ili interesovanja, kako cete znati gdje da trazite? Posto je ime osobe donekle jedinstveno, to bi bila dobra prilika za upotrebu masine za pretrazivanje po kljucnoj rijeci. Isto tako, ako pokusavate da saznate da li je odredjeni zagadjivac u vodi opasan, moguce je da ne znate tacno koje ministarstvo ili organizacija se bavi efektima te supstance na covjekovu okolinu. Vas najbolji izvor informacija na tu temu bi mogao da potice i od nekog ministarstva, univerziteta, ili grupe za zastitu covjekove okoline.
Sustina je u definisanju termina po kojima se pretrazuje tako da oni jedinstveno opisuju, a time i jedinstveno identifikuju ono sto trazite. Sto su jedinstveniji termini po kojima pretrazujete, to ce vam masina za pretrazivanje po kljucnoj rijeci dati bolje rezultate. Razmislite sta je to sto vasu temu cini jedinstvenom. Evo nekih podataka koji vase pretrazivanje u potrazi za nekom osobom mogu uciniti jedinstvenim:
- email adresa
- maticni broj
- broj telefona
- adresa
- ime
- zanimanje
- ime firme
- veza sa odredjenim organizacijama
Obratite paznju na to da podaci obiljezeni plavom bojom jedinstveno identifikuju neku osobu - email adresa neke osobe je njena sopstvena email adresa, a i maticni broj svakog pojedinca je jedinstven. Email adrese su jedan od najboljih nacina za pronalazenje pojedinaca na webu. Uvijek uzimajte email adrese od ljudi koje poznajete.
Podaci obiljezeni zelenom bojom su uglavnom jedinstveni: svaka osoba ima par brojeva telefona i adresa - neki brojevi i adrese ih jedinstveno identifikuju, ali neke dijele sa sustanarima, porodicom ili kolegama. Podaci obiljezeni crvenom bojom nisu uvijek jedinstveni. Mnogi ljudi imaju isto ime, pri cemu su neka imena jedinstvena, a neka veoma rasprostranjena. Zato neko uobicajeno ime, kao sto je John Smith, treba kombinovati sa drugim terminima koji ce ga uciniti jedinstvenim. Na primjer, moguce je da samo jedan John Smith radi za Goodyear Tire u Youngstown, u drzavi Ohio.
U lekciji 6 govoricemo o Bulovoj logici - to je pomocno sredstvo kojim se sluzimo da bismo upit za pretrazivanje ucinili jedinstvenijim.
All material Copyright © 2000 Drew Sullivan
unless otherwise indicated.
All Rights
Reserved