Vyhledávač

Z MiS
(Rozdíly mezi verzemi)
Přejít na: navigace, hledání
m (Tipy pro vyhledávání: Oprava vzhledu)
(Oprava struktury)
Řádka 1: Řádka 1:
 
[[Category:VSE]][[Category:CRI]][[Category:Internet]][[Category:Informatika]][[Category:Stránky s obrázky]]
 
[[Category:VSE]][[Category:CRI]][[Category:Internet]][[Category:Informatika]][[Category:Stránky s obrázky]]
  
== Historie vyhledávačů ==
+
== Typy vyhledávačů ==
; Google (1998)
+
=== Katalogový vyhledávač ===
*příklad fulltextového vyhledávače,
+
* vznikl na základě vědecké práce,
+
*autoři Sergey Brin a Larry Page, Stanfordská univerzita.
+
 
+
== Katalogový vyhledávač ==
+
 
*firmy.seznam.cz
 
*firmy.seznam.cz
 
*Historicky starší varianta.
 
*Historicky starší varianta.
Řádka 15: Řádka 10:
 
*Příklad: [http://www.firmy.cz Firmy.cz] (součást Seznamu.cz)
 
*Příklad: [http://www.firmy.cz Firmy.cz] (součást Seznamu.cz)
  
== Fulltextový vyhledávač ==
+
=== Fulltextový vyhledávač ===
 
*„Katalog“ se vytváří automaticky podle četnosti výskytu slov ve stránce a dalších indicií.
 
*„Katalog“ se vytváří automaticky podle četnosti výskytu slov ve stránce a dalších indicií.
 
*Příklady: [http://www.seznam.cz Seznam.cz], [http://www.google.com Google.com].
 
*Příklady: [http://www.seznam.cz Seznam.cz], [http://www.google.com Google.com].
 
<div class="Poznamka">
 
<div class="Poznamka">
Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏
+
Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏</div>
</div>
+
  
; Postup vytváření indexu (databáze)
+
=== Metavyhledávač ===
 +
*Agreguje výsledky více vyhledávačů.
 +
 
 +
 
 +
== Funkce fulltextového vyhledávače ==
 +
=== Vytváření indexu (databáze) ===
 
*prochází stránky automaticky
 
*prochází stránky automaticky
 
**„robot“ pro stahování stránek,
 
**„robot“ pro stahování stránek,
Řádka 33: Řádka 32:
 
** podle počtu odkazů na stránku a významu stránek, které se na tuto odkazují.
 
** podle počtu odkazů na stránku a významu stránek, které se na tuto odkazují.
  
[[File:vyhledavac.png]]
+
=== Zpracování dotazu ===
 
+
; Zpracování dotazu
+
 
* Převod zadaných slov na fráze,
 
* Převod zadaných slov na fráze,
 
**vyřazení krátkých slov
 
**vyřazení krátkých slov
Řádka 50: Řádka 47:
 
* Vypíše stránky s nejlepším hodnocením
 
* Vypíše stránky s nejlepším hodnocením
  
; Moduly fulltextového vyhledávače
+
=== Moduly fulltextového vyhledávače ===
 +
[[File:vyhledavac.png]]
 +
 
 
*URL server
 
*URL server
 
** při čtení dokumentu získává URL adresy a dává je crawleru,
 
** při čtení dokumentu získává URL adresy a dává je crawleru,
Řádka 73: Řádka 72:
 
**udává, jak je který termín významný pro danou stránku
 
**udává, jak je který termín významný pro danou stránku
  
== Relevance ==
+
 
*Jak významná je hledaná fráze pro dokument:
+
== Relevance fráze ==
**kolikrát se vyskytuje,
+
*Jak významná je hledaná fráze pro dokument?
**je v názvu?
+
; Vliv má:
**…
+
* kolikrát se fráze v dokumentu vyskytuje?
 +
* je uvedena v názvu stránky?
 +
* je uvedena v hlavičce v ''keywords''? (někdy se záměrně ignoruje)
 +
* je uvedena v adrese?
 +
* je na stránce fráze zvýrazněná?
 +
* …
 +
 
  
 
== Význam dokumentu ==
 
== Význam dokumentu ==
; page-rank
+
Při množství stránek v dnešním Internetu je třeba hodnotit stránky ještě jinými způsoby než jen podle výskytu hledaných frází.
 +
 
 +
; Page-rank
 
* Algoritmus představený poprvé ve vyhledávači Google.
 
* Algoritmus představený poprvé ve vyhledávači Google.
 
* Dnes implementují v nějaké formě všechny fulltextové vyhledávače.
 
* Dnes implementují v nějaké formě všechny fulltextové vyhledávače.
 +
 
; Jak významný je dokument?
 
; Jak významný je dokument?
*Kolik velkých stránek odkazuje na dokument,
+
* Kolik velkých stránek (stránek s dobrý hodnocením) odkazuje na dokument?
*kolik odkazů na dokument máme,
+
* Kolik odkazů na dokument máme?
* jak významné dokumenty na tento dokument odkazují,
+
 
*
+
; Hodnotí se také další vlivy:
 +
* Je dokument validní?
 +
* Není v dokumentu nápadně mnoho výskytů stejného slova?
 +
* Je dokument dobře strukturován?
 +
* …
 +
 
 +
 
 +
== Historie vyhledávačů ==
 +
; Google (1998)
 +
*příklad fulltextového vyhledávače,
 +
* vznikl na základě vědecké práce,
 +
*autoři Sergey Brin a Larry Page, Stanfordská univerzita.
  
== Metavyhledávače ==
 
*Agregují výsledky více vyhledávačů
 
  
 
== Tipy pro vyhledávání ==
 
== Tipy pro vyhledávání ==

Verze z 20. 11. 2014, 17:14


Obsah

Typy vyhledávačů

Katalogový vyhledávač

Fulltextový vyhledávač

Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏

Metavyhledávač


Funkce fulltextového vyhledávače

Vytváření indexu (databáze)

Zpracování dotazu

Moduly fulltextového vyhledávače

Vyhledavac.png


Relevance fráze

Vliv má


Význam dokumentu

Při množství stránek v dnešním Internetu je třeba hodnotit stránky ještě jinými způsoby než jen podle výskytu hledaných frází.

Page-rank
Jak významný je dokument?
Hodnotí se také další vlivy


Historie vyhledávačů

Google (1998)


Tipy pro vyhledávání

Pokročilé vyhledávání
VOŠ site:www.oauh.cz
"obchodní škola"
virus –internet
VOŠ –site:www.oauh.cz
Osobní nástroje
Jmenné prostory
Varianty
Akce
Výuka
Navigace
Nástroje