Lekcija 7
Bulova logika je od sustinskog znacaja, ali nije i jedini nacin koristenja masina za pretrazivanje po kljucnoj rijeci. U sklopu vecine masina za pretrazivanje po kljucnoj rijeci postoji jos jedno mocno sredstvo koje vam pomaze da efikasnije pronadjete informacije. To je pretrazivanje po tagovima koje vam omogucava da pretrazujete tagove koje su web dizajneri koristili pri kreiranju web strana. U pitanju je skriveni trik za pretrazivanje po webu, koji vam, ako ga ispravno koristite, moze ustedeti vrijeme pri svakom pretrazivanju.
Ipak, prvo moramo nesto reci o tome sta su tagovi i kako se prave web strane.
Strukturu svake web strane mozete videti tako sto cete kliknuti na dugme View pri vrhu strane u Internet Exploreru, a zatim na opciju Source. Ono sto sada vidite pred sobom zove se jezik za oznacavanje hiperteksta ili HTML. To je kod koji web dizajneri koriste da bi rekli pretrazivacu na koji nacin da prikaze informacije na jednoj web strani; na primjer: koji font da koristi, gdje da centrira tekst, ili gdje da stavi slike i druge graficke elemente. Da bi se na strani pojavila tacno odredjena velicina slova, ili da bi se tekst centrirao na odredjeni nacin, u HTML-u se koriste tagovi koji se nalaze sa obe strane odabranog dijela teksta. Na primjer, da bismo centrirali tekst, koristicemo sljedece tagove:
<center>Ovako centriramo tekst</center>
Rijeci u uglastim zagradama su tagovi, i obicno se javljaju u paru: jedan ide ispred teksta, a drugi poslije. Tagu koji zatvara tekst dodaje se kosa crta (kao u navedenom primjeru) da bi se naglasilo da se njime zatvara operacija centriranja. Pocetni i krajnji tag u jednom dokumentu mogu biti veoma udaljeni.
Unio sam neka objasnjenja izvornog HTML koda ove strane da bih objasnio neke od grafickih elemenata. Necu detaljno objasnjavati HTML jer su to drugi vec bolje uradili. Zato sam na dno strane postavio linkove na neke dobre pocetne lekcije o HTML-u.
Za bolje pretrazivanje potrebno je, za pocetak, da poznajete barem dva taga, a to su tag za naslovi i tag za link i tekst linka.
Tag za naslov: <title> </title>
Na vrhu web strane u bilo kom pretrazivacu (na plavoj liniji) naci cete naslov te strane. Na primjer, naslov ove strane je “Lekcija 7 (ovo je naslov)”. Google, AllTheWeb, AltaVista i neke druge masine za pretrazivanje omogucavaju vam da pretrazujete po naslovu strane. Zasto je to vazno? Pa, zato sto je naslov najsazetiji opis jedne web strane. Ako trazite neku rijec koja se pritom nalazi i u naslovu strane, vjerovatnije je da cete tako naici na stranu koju zapravo trazite. Masine za pretrazivanje cesto koriste tag za naslov i da bi pronadjene strane poredale po vaznosti (za to se, izmedju ostalog, koristi i kriterij ucestalosti pojavljivanja rijeci na strani).
Recimo da trazimo web strane koje se ticu bosanskog pop-pjevaca Dine Merlina. Merlin se vjerovatno pominje na stotinama strana, ali ce se na mnogim od strana koje dobijamo kao rezultat pojaviti tek uzgred (npr. Moj momak lici na Dina Merlina). Medjutim, ako trazimo strane na kojima se Merlin pominje u naslovu, sva je prilika da cemo naci strane koje su uglavnom posvjecene Merlinu. Da bismo pretrazivali po naslovu u Googlu, unijeli bismo sljedeci upit u okvir na polaznoj strani:
allintitle: dino merlin (ovim govorimo masini da obe navedene reci treba da se nadju u naslovu)
Google ovu opciju podrzava i u okviru za napredno pretrazivanje (advanced search). Treba odabrati jedan od kliznih menija pod odrednicom Occurrence, a zatim return results where my terms occur in the title of the page (naci rezultate gdje se moji termini pojavljuju u naslovu strane).
Link i tekst linka
Ova pretraga koristi informacije koje sadrzi link. Link je podvuceni tekst koji vas, kada na njega kliknete, vodi na drugu web stranu. U HTML-u jedan link izgleda ovako:
<a href="http://www.netnovinar.org/index.html"> stranica NetNovinara</a>
Na pravoj web strani navedeni kod bi izgledao ovako:
Tag se sastoji od dva dijela: adrese i teksta linka (anchor).
Adresa je zapravo adresa web strane na koju cete otici kada kliknete na link (u ovom slucaju to je www.netnovinar.org/index.html). Tekst linka su podvucene rijeci na koje cete kliknuti da bi vas odvjele na datu adresu (u ovom slucaju te rijeci su Stranica NetNovinara). Primjeticete da kada kursorom predjete preko gornjeg plavo obojenog teksta linka vidite adresu u donjem lijevom uglu brauzera.
Sama adresa se sastoji od dva dijela. Prvi dio adrese (www.netnovinar.org) je ime domena. Secate se iz Lekcije 1 da ime domena jedinstveno identifikuje web server na Internetu. Kao dio imena domena imamo ekstenziju (.org) koja identifikuje tip web sajta (u ovom slucaju to je sajt neprofitne organizacije).
Google vam omogucava da pretrazujete gore navedeni tag na tri nacina. Imajte na umu da su ove "komande" donekle zbunjujuce u prvo vrijeme:
site: omogucava pretrazivanje po ekstenziji u imenu domena ili po odredjenom imenu domena
inurl: i allinurl: omogucava pretrazivanje po bilo kojoj rijeci u web adresi ili URL-u
Na primjer:
site:org pretrazuje u okviru domena neprofitnih organizacija (npr. www.netnnovinar.org) site:www.un.org pretrazuje samo strane na sajtu Ujedinjenih nacija (web adrese svih dobijenih strana pocinjace sa www.un.org). inurl:bosna trazi rijec "bosna" u bilo kom dijelu adrese (npr.www.un.org/womenwatch/bosnia.htm) allinurl:bosna internet obje kljucne rijeci ce biti u url-u, tj. adresi nadjenih stranica Napomena: sve ove komande funkcionisu samo ako uz njih navedete i kljucnu rijec koja vas zanima - site:org nece dati nikakve rezultate, ali ce bosna site:org dati sve stranice u okviru domena .org na kojima se pominje Bosna.
Jos jedan operator/"komanda" za pretragu je veoma praktican link koji omogucava pronalazenje bilo koje web stranice koja se linkuje na odredjenu stranicu. Format linka je operator/"komanda" pracen adresom. Tako cemo sljedecim upitom
link: www.un.org
doci do bilo kojeg web sajta koji se linkuje na web sajt UN-a.
A sada evo detaljnog pregleda ovih i slicnih naprednih operatora u Googlu, AlltheWebu i AltaVisti.
Kada treba koristiti navedene upite?
Site: je koristan kada zelite da ogranicite siroke pretrage. Na primjer, ako hocete da nadjete zvanicni sajt vlade SAD, site:gov ce ograniciti vasu pretragu samo na sajtove iz domene .gov.
Nezamenjljiv je kada hocete da nadjete samo jednu tacno odredjenu stranu na nekom velikom sajtu. Na primjer, ako hocete da vidite kakvu ulogu ima U.S. Environmental Protection Agency u vezi sa rijekom Anakostia, onda ce sljedeci upit naci svako pojavljivanje rijeci Anakostija na sajtu EPA.
site:www.epa.gov "anacostia river"
Operator link je uvijek koristan. Kao novinari, mi uvijek tragamo za obema stranama u prici. Ako radite pricu o nekoj organizaciji, trazicete ljude koji se slazu sa s njom, kao i one koji se ne slazu. Na Webu se i prijatelji i protivnici odredjene organizacije, institucije, firme linkuju na njen sajt. U navedenom primjeru naci cete mnostvo sajtova koji podrzavaju UN, ali i neke koji se kriticke odnose prema ovoj organizaciji..
Napredno pretrazivanje u Google-u obavlja neke od istih operacija za koje smo upravo naucili komande, samo sto su u formi kliznog menija. Na zalost, Google ne podrzava upotrebu operatora anchor koji podrzava Alta Vista. Ako zelite da saznate vise o ovim alatkama, procitajte odlicne podsjetnike koje daju Google, Altavista i AllTheWeb.
Evo linkova na preglede naprednih operatora u
Kao sto smo i obecali, evo vodica za HTML:
- Yahoo vodic kroz sajtove o HTML-u
- HTML vodic za pocetnike Univerziteta u Majamiju (prilicno dobar)
- Webcom vodic za pocetnike
- Indeks HTML tagova (neka vrsta rjecnika HTML-a)
All material Copyright © 2000 Drew Sullivan
unless otherwise indicated.
All Rights
Reserved