Vyhledávač

Z MiS
(Rozdíly mezi verzemi)
Přejít na: navigace, hledání
(Fulltextový vyhledávač: Drobné úpravy a přidán obrázek)
(Vývoj vyhledávačů přesunut do stránky Historie Internetu.)
 
(Není zobrazeno 6 mezilehlých verzí od 1 uživatele.)
Řádka 1: Řádka 1:
[[Category:VSE]][[Category:CRI]][[Category:Internet]][[Category:Informatika]]
+
[[Category:VSE]][[Category:CRI]][[Category:Internet]][[Category:Informatika]][[Category:Stránky s obrázky]]
  
== Historie vyhledávačů ==
+
== Typy vyhledávačů ==
; Google (1998)
+
=== Katalogový vyhledávač ===
*příklad fulltextového vyhledávače,
+
* vznikl na základě vědecké práce,
+
*autoři Sergey Brin a Larry Page, Stanfordská univerzita.
+
 
+
== Katalogový vyhledávač ==
+
*firmy.seznam.cz
+
 
*Historicky starší varianta.
 
*Historicky starší varianta.
 
*Obvykle pevně dané kategorie, podle kterých se třídí.
 
*Obvykle pevně dané kategorie, podle kterých se třídí.
Řádka 15: Řádka 9:
 
*Příklad: [http://www.firmy.cz Firmy.cz] (součást Seznamu.cz)
 
*Příklad: [http://www.firmy.cz Firmy.cz] (součást Seznamu.cz)
  
== Fulltextový vyhledávač ==
+
=== Fulltextový vyhledávač ===
*„Katalog“ se vytváří automaticky podle četnosti výskytu slov ve stránce a dalších indicií.
+
*Příklady: [http://www.seznam.cz Seznam.cz], [http://www.google.com Google.com].
+
 
<div class="Poznamka">
 
<div class="Poznamka">
Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏
+
Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏</div>
</div>
+
  
; Postup vytváření indexu (databáze)
+
*„Katalog“ se vytváří automaticky podle četnosti výskytu slov ve stránce a dalších indicií.
 +
*Příklady:
 +
** [http://www.seznam.cz Seznam.cz],
 +
** [http://www.google.com Google.com],
 +
** [http://www.duckduckgo.com DuckDuckGo.com] (neukládá informace o&nbsp;uživateli a&nbsp;jeho vyhledávání)
 +
 
 +
=== Metavyhledávač ===
 +
*Agreguje výsledky více vyhledávačů.
 +
 
 +
 
 +
== Funkce fulltextového vyhledávače ==
 +
=== Vytváření indexu (databáze) ===
 
*prochází stránky automaticky
 
*prochází stránky automaticky
 
**„robot“ pro stahování stránek,
 
**„robot“ pro stahování stránek,
Řádka 33: Řádka 35:
 
** podle počtu odkazů na stránku a významu stránek, které se na tuto odkazují.
 
** podle počtu odkazů na stránku a významu stránek, které se na tuto odkazují.
  
[[File:vyhledavac.png]]
+
=== Zpracování dotazu ===
 
+
; Zpracování dotazu
+
 
* Převod zadaných slov na fráze,
 
* Převod zadaných slov na fráze,
 
**vyřazení krátkých slov
 
**vyřazení krátkých slov
Řádka 50: Řádka 50:
 
* Vypíše stránky s nejlepším hodnocením
 
* Vypíše stránky s nejlepším hodnocením
  
; Moduly fulltextového vyhledávače
+
=== Moduly fulltextového vyhledávače ===
 +
[[File:vyhledavac.png]]
 +
 
 
*URL server
 
*URL server
 
** při čtení dokumentu získává URL adresy a dává je crawleru,
 
** při čtení dokumentu získává URL adresy a dává je crawleru,
Řádka 73: Řádka 75:
 
**udává, jak je který termín významný pro danou stránku
 
**udává, jak je který termín významný pro danou stránku
  
== Relevance ==
+
 
*Jak významná je hledaná fráze pro dokument:
+
== Relevance fráze ==
**kolikrát se vyskytuje,
+
*Jak významná je hledaná fráze pro dokument?
**je v názvu?
+
; Vliv má:
**…
+
* kolikrát se fráze v dokumentu vyskytuje?
 +
* je uvedena v názvu stránky?
 +
* je uvedena v hlavičce v ''keywords''? (někdy se záměrně ignoruje)
 +
* je uvedena v adrese?
 +
* je na stránce fráze zvýrazněná?
 +
* …
 +
 
  
 
== Význam dokumentu ==
 
== Význam dokumentu ==
; page-rank
+
Při množství stránek v dnešním Internetu je třeba hodnotit stránky ještě jinými způsoby než jen podle výskytu hledaných frází.
 +
 
 +
; Page-rank
 
* Algoritmus představený poprvé ve vyhledávači Google.
 
* Algoritmus představený poprvé ve vyhledávači Google.
 
* Dnes implementují v nějaké formě všechny fulltextové vyhledávače.
 
* Dnes implementují v nějaké formě všechny fulltextové vyhledávače.
 +
 
; Jak významný je dokument?
 
; Jak významný je dokument?
*Kolik velkých stránek odkazuje na dokument,
+
* Kolik velkých stránek (stránek s dobrý hodnocením) odkazuje na dokument?
*kolik odkazů na dokument máme,
+
* Kolik odkazů na dokument máme?
* jak významné dokumenty na tento dokument odkazují,
+
 
*…
+
; Hodnotí se také další vlivy:
 +
* Je dokument validní?
 +
* Není v dokumentu nápadně mnoho výskytů stejného slova?
 +
* Je dokument dobře strukturován?
 +
* …
  
== Metavyhledávače ==
 
*Agregují výsledky více vyhledávačů
 
  
 
== Tipy pro vyhledávání ==
 
== Tipy pro vyhledávání ==
Řádka 103: Řádka 116:
 
*<code>filetype:</code> typ souboru
 
*<code>filetype:</code> typ souboru
 
**speciálně vyhledávání obrázků
 
**speciálně vyhledávání obrázků
*přesná fráze:
+
* Uvozovky &mdash; hledání přesné fráze &mdash; slova se musí vyskytovat v tomto pořadí:
 
  "obchodní škola"
 
  "obchodní škola"
*umístění fráze:
+
* Konkrétní umístění fráze:
**v titulku, v adrese, v textu stránky,…
+
** v titulku stránky, v adrese, v textu stránky,…
*omezení stáří dokumentu,
+
* Omezení stáří dokumentu.
*Znaménko „minus“ znamená vyloučení.
+
* Znaménko „minus“ znamená vyloučení.
 +
*# Hledáme stránky, obsahující slovo ''virus'' a neobsahující přitom slovo ''internet''.
 +
*# Hledáme slovo ''VOŠ'' někde jinde než na stránkách ''OAUH.cz'':
 
  virus –internet
 
  virus –internet
*�stránky, obsahující slovo virus�a neobsahující slovo internet.
+
  VOŠ –site:www.oauh.cz
  VOŠ –site:www.oauh.cz  
+
 
* �„VOŠ“ někde jinde než na stránkách OAUH.
+
 
 +
== Související stránky ==
 +
* [[Historie Internetu#Vyhledávače| Vývoj vyhledávačů]]

Aktuální verze z 12. 10. 2023, 07:09


Obsah

Typy vyhledávačů

Katalogový vyhledávač

Fulltextový vyhledávač

Myšlenka: stránky, kde se často vyskytuje slovo „klavír“ se budou nejspíš týkat klavírů a měly by tedy být vráceny při dotazu „klavír“ na prvním místě. ;)‏

Metavyhledávač


Funkce fulltextového vyhledávače

Vytváření indexu (databáze)

Zpracování dotazu

Moduly fulltextového vyhledávače

Vyhledavac.png


Relevance fráze

Vliv má


Význam dokumentu

Při množství stránek v dnešním Internetu je třeba hodnotit stránky ještě jinými způsoby než jen podle výskytu hledaných frází.

Page-rank
Jak významný je dokument?
Hodnotí se také další vlivy


Tipy pro vyhledávání

Pokročilé vyhledávání
VOŠ site:www.oauh.cz
"obchodní škola"
virus –internet
VOŠ –site:www.oauh.cz


Související stránky

Osobní nástroje
Jmenné prostory
Varianty
Akce
Výuka
Navigace
Nástroje