• Populární vyhledávače na světě. Jaké jsou vyhledávače

    co to je

    DuckDuckGo je poměrně známý open source vyhledávač. zdrojový kód. Servery jsou umístěny v USA. Kromě vlastního robota využívá vyhledávač výsledky dalších zdrojů: Yahoo, Bing, Wikipedia.

    Ten lepší

    DuckDuckGo se staví jako dokonalé vyhledávání soukromí a soukromí. Systém neshromažďuje žádná data o uživateli, neukládá protokoly (žádná historie vyhledávání), používání cookies maximálně omezený.

    DuckDuckGo neshromažďuje ani nesdílí osobní údaje od uživatelů. Toto jsou naše zásady ochrany osobních údajů.

    Gabriel Weinberg, zakladatel DuckDuckGo

    Proč to potřebuješ?

    Všechny velké vyhledávače se snaží personalizovat výsledky vyhledávání na základě údajů o osobě před monitorem. Tento jev se nazývá „filtrační bublina“: uživatel vidí pouze ty výsledky, které jsou v souladu s jeho preferencemi nebo které systém za takové považuje.

    Vytváří objektivní obrázek, který nezávisí na vašem minulém chování na webu, a eliminuje tématiku google reklamy a "Yandex", na základě vašich požadavků. S pomocí DuckDuckGo je snadné vyhledávat informace v cizích jazycích, zatímco Google a Yandex ve výchozím nastavení preferují rusky psané stránky, i když je dotaz zadán v jiném jazyce.


    co to je

    not Evil je systém, který prohledává anonymní síť Tor. Chcete-li jej použít, musíte do této sítě přejít například spuštěním specializovaného .

    not Evil není jediným vyhledávačem svého druhu. K dispozici je LOOK (výchozí vyhledávání v prohlížeči Tor, přístupné z běžného internetu) nebo TORCH (jeden z nejstarších vyhledávačů v síti Tor) a další. Rozhodli jsme se ne Zlo kvůli nezaměnitelné narážce na Google (stačí se podívat na úvodní stránku).

    Ten lepší

    Hledání tam kde google, "Yandex" a další vyhledávače jsou v zásadě uzavřeny.

    Proč to potřebuješ?

    V síti Tor je mnoho zdrojů, které nelze nalézt na internetu, který dodržuje zákony. A jejich počet poroste s tím, jak se zpřísní kontrola úřadů nad obsahem webu. Tor je druh sítě v rámci webu se svými sociálními sítěmi, sledovači torrentů, médii, tržišti, blogy, knihovnami a tak dále.

    3. YaCy

    co to je

    YaCy je decentralizovaný vyhledávač, který funguje na principu P2P sítí. Každý počítač, který má primární softwarový modul, prohledává internet sám o sobě, to znamená, že jde o obdobu vyhledávacího robota. Získané výsledky jsou shromažďovány ve společné databázi, kterou využívají všichni účastníci YaCy.

    Ten lepší

    Zde je těžké říci, zda je to lepší nebo horší, protože YaCy je zcela odlišný přístup k organizaci vyhledávání. Neexistence jediného serveru a společnosti vlastníka činí výsledky zcela nezávislými na preferencích kohokoli. Autonomie každého uzlu vylučuje cenzuru. YaCy je schopen prohledávat hluboký web a neindexované veřejné sítě.

    Proč to potřebuješ?

    Pokud jste zastáncem open source softwaru a svobodného internetu, který není ovlivňován státními úřady a velkými korporacemi, pak je YaCy vaše volba. Lze jej také použít k organizaci vyhledávání v rámci společnosti nebo jiné společnosti offline síť. A přestože YaCy není v každodenním životě příliš užitečný, stojí za to alternativa ke Googlu z hlediska procesu vyhledávání.

    4. Pipl

    co to je

    Pipl je systém určený k vyhledávání informací o konkrétní osobě.

    Ten lepší

    Autoři Pipl tvrdí, že jejich specializované algoritmy vyhledávají efektivněji než „běžné“ vyhledávače. Prioritou jsou zejména profily na sociálních sítích, komentáře, seznamy účastníků a různé databáze, kde jsou zveřejňovány informace o lidech, například databáze soudních rozhodnutí. Vedení Pipl v této oblasti potvrzují Lifehacker.com, TechCrunch a další publikace.

    Proč to potřebuješ?

    Pokud potřebujete najít informace o osobě žijící v USA, pak Pipl bude mnohem víc efektivnější než Google. Databáze ruských soudů jsou zjevně pro vyhledávač nepřístupné. S občany Ruska si proto tak dobře neporadí.

    co to je

    FindSounds je další specializovaný vyhledávač. Vyhledává v otevřených zdrojích různé zvuky: dům, příroda, auta, lidé atd. Služba nepodporuje požadavky v ruštině, ale existuje působivý seznam značek v ruském jazyce, které můžete vyhledat.

    Ten lepší

    Ve vydávání pouze zvuků a nic víc. V nastavení si můžete nastavit požadovaný formát a kvalitu zvuku. Všechny nalezené zvuky jsou k dispozici ke stažení. Existuje vyhledávání vzorů.

    Proč to potřebuješ?

    Pokud potřebujete rychle najít zvuk výstřelu z muškety, ránu sajícího datla nebo výkřik Homera Simpsona, pak je tato služba určena právě vám. A to jsme vybrali pouze z dostupných ruskojazyčných dotazů. V angličtině je spektrum ještě širší.

    Pokud vážně, specializovaný servis navrhuje specializované publikum. Přijde ale vhod i vám?

    co to je

    Wolfram|Alpha je výpočetní vyhledávač. Místo odkazů na články obsahující klíčová slova dává hotovou odpověď na požadavek uživatele. Pokud například zadáte do vyhledávacího formuláře „porovnat populaci New Yorku a San Francisca“ v angličtině, Wolfram|Alpha okamžitě zobrazí tabulky a grafy s porovnáním.

    Ten lepší

    Tato služba je lepší než ostatní pro vyhledávání faktů a výpočet dat. Wolfram|Alpha shromažďuje a organizuje znalosti dostupné na webu z různých oblastí, včetně vědy, kultury a zábavy. Pokud tato databáze obsahuje připravenou odpověď na vyhledávací dotaz, systém ji zobrazí, pokud ne, spočítá a zobrazí výsledek. V tomto případě uživatel vidí jen a nic víc.

    Proč to potřebuješ?

    Pokud jste například student, analytik, novinář nebo výzkumník, můžete použít Wolfram|Alpha k vyhledání a výpočtu dat souvisejících s vašimi aktivitami. Služba nerozumí všem požadavkům, ale neustále se vyvíjí a je chytřejší.

    co to je

    Metasearch engine Dogpile zobrazuje kombinovaný seznam výsledků z Google, Yahoo a dalších oblíbených vyhledávačů.

    Ten lepší

    Za prvé, Dogpile zobrazuje méně reklam. Za druhé, služba používá k nalezení a zobrazení speciální algoritmus nejlepší skóre z různých vyhledávačů. Podle vývojářů Dogpile jejich systém generuje nejúplnější problém na celém internetu.

    Proč to potřebuješ?

    Pokud nemůžete najít informace na Googlu nebo jiném standardním vyhledávači, vyhledejte je v několika vyhledávačích najednou pomocí Dogpile.

    co to je

    BoardReader je textový vyhledávací systém pro fóra, služby Q&A a další komunity.

    Ten lepší

    Služba umožňuje zúžit pole vyhledávání na sociální stránky. Díky speciálním filtrům můžete rychle najít příspěvky a komentáře, které odpovídají vašim kritériím: jazyk, datum vydání a název webu.

    Proč to potřebuješ?

    BoardReader může být užitečný pro PR specialisty a další mediální profesionály, kteří se zajímají o názor masmédií na určitá témata.

    Konečně

    Život alternativních vyhledávačů je často pomíjivý. Lifehacker se zeptal bývalého generálního ředitele ukrajinské pobočky společnosti Yandex Sergeje Petrenka na dlouhodobé vyhlídky takových projektů.


    Sergej Petrenko

    Bývalý výkonný ředitel"Yandex.Ukrajina".

    Pokud jde o osud alternativních vyhledávačů, je jednoduchý: být velmi úzce specializovanými projekty s malým publikem, tedy bez jasných komerčních vyhlídek, nebo naopak s naprostou jasností jejich absence.

    Když se podíváte na příklady v článku, můžete vidět, že takové vyhledávače se buď specializují na úzkou, ale poptávanou niku, která se snad jen zatím nerozrostla natolik, aby byla patrná na radarech Googlu nebo Yandexu, nebo testují původní hypotézu v hodnocení, která zatím není použitelná v konvenčním vyhledávání.

    Pokud se například náhle ukáže, že vyhledávání Tor je žádané, to znamená, že alespoň procento publika Google bude potřebovat výsledky odtud, pak samozřejmě běžné vyhledávače začnou řešit problém, jak najděte je a ukažte je uživateli. Pokud chování publika ukazuje, že se zdá, že značná část uživatelů ve značném počtu dotazů má relevantnější výsledky, data bez zohlednění faktorů, které závisí na uživateli, pak Yandex nebo Google začnou poskytovat takové výsledky.

    „Být lepší“ v kontextu tohoto článku neznamená „být lepší ve všem“. Ano, v mnoha ohledech jsou naši hrdinové daleko od Yandexu (dokonce daleko od Bingu). Ale každá z těchto služeb dává uživateli něco, co giganti z vyhledávacího průmyslu nemohou nabídnout. Určitě také znáte podobné projekty. Podělte se s námi - pojďme diskutovat.

    Vyhledávač je databáze konkrétních informací na internetu. Mnoho uživatelů se domnívá, že jakmile zadají dotaz do vyhledávače, okamžitě je prolezen celý internet, ale vůbec tomu tak není. Skenování internetu probíhá neustále, mnoho programů, údaje o webech jsou zadávány do databáze, kde jsou podle určitých kritérií všechny weby a všechny jejich stránky distribuovány do různých seznamů a databází. To znamená, že jde o druh datového souboru a vyhledávání neprobíhá na internetu, ale v tomto souboru.

    Google je nejpopulárnější vyhledávač na světě.

    Kromě vyhledávače nabízí Google mnoho doplňkových služeb, softwaru a hardwaru, včetně poštovní služby, prohlížeče Google Chrome, největší videotéky youtube a mnoha dalších projektů. Google sebevědomě skupuje mnoho projektů, které přinášejí velké zisky. Většina služeb není zaměřena na přímého uživatele, ale na vydělávání peněz na internetu a jsou integrovány se zaměřením na zájmy evropských a amerických uživatelů.

    Mail je vyhledávač oblíbený především díky poštovní službě.

    Existuje mnoho doplňkových služeb, jejichž klíčem je mail Mail, on tento moment Mail vlastní sociální síť Odnoklassniki, vlastní síť"Můj svět", Money-mailová služba, sada online hry, tři téměř identické prohlížeče s různými názvy. Všechny aplikace a služby mají spoustu reklamního obsahu. Sociální síť "Vkontakte" blokuje přímé přechody na Poštovní služby, dohadování velké množství viry.

    Wikipedie.

    Wikipedie je prohledávatelný referenční systém.

    Neziskový vyhledávač, který existuje na soukromé dary, proto nezaplňuje stránky reklamou. Vícejazyčný projekt, jehož cílem je vytvořit kompletní referenční encyklopedii ve všech jazycích světa. Nemá žádné konkrétní autory, vyplňují a spravují ho dobrovolníci z celého světa. Každý uživatel může psát i upravovat článek.

    Oficiální stránka- www.wikipedia.org.

    Youtube je největší videotéka.

    Video hosting s prvky sociální síť kde každý uživatel může přidat video. Od okamžiku, kdy je získal Google Ink, není nutná samostatná registrace pro YouTube, stačí se zaregistrovat do poštovní služby Google.

    Oficiální stránka je youtube.com.

    Yahoo! je druhý nejdůležitější vyhledávač na světě.

    Dostupný Doplňkové služby, z nichž nejznámější je yahoo mail. V rámci zlepšování kvality vyhledávače Yahoo předává data o uživatelích a jejich dotazech Microsoftu. Z těchto údajů se vytváří představa o zájmech uživatelů a také o trhu s reklamním obsahem. Vyhledávač Yahoo se také zabývá pohlcováním jiných společností, například Yahoo vlastní vyhledávací službu Altavista a webové stránky elektronický obchod Alibaba.

    Oficiální stránka je www.yahoo.com.

    WDL je digitální knihovna.

    Knihovna shromažďuje knihy kulturní hodnoty digitální podobě. Hlavním cílem je zvýšit úroveň kulturního obsahu internetu. Vstup do knihovny je zdarma.

    Oficiální stránka je www.wdl.org/ru/.

    Bing je vyhledávač od společnosti Microsoft.

    Oficiální stránka je www.baidu.com.

    Vyhledávače Rusko

    Rambler je „proamerický“ vyhledávač.

    Původně vznikl jako mediální internetový portál. Stejně jako mnoho jiných vyhledávačů má služby pro vyhledávání obrázků, video soubory, mapy, předpověď počasí, sekci zpráv a mnoho dalšího. Vydavatelé také nabízejí bezplatný prohlížeč Rambler-Nichrome.

    Oficiální stránka je www.rambler.ru.

    Nigma je inteligentní vyhledávač.

    Pohodlnější vyhledávač díky přítomnosti mnoha filtrů a nastavení. Rozhraní vám umožňuje zahrnout nebo vyloučit navrhované podobné hodnoty ve vyhledávání, abyste získali lepší výsledky. Při příjmu výsledku vyhledávání vám také umožňuje používat informace z jiných velkých vyhledávačů.

    Oficiální stránka je www.nigma.ru.

    Aport - online katalog zboží.

    V minulosti vyhledávač, ale po ukončení vývoje a inovací rychle ztratil půdu pod nohama a . V v současné době Aport je obchodní platforma, která představuje produkty od více než 1500 firem.

    Oficiální stránka je www.aport.ru.

    Sputnik je národní vyhledávač a internetový portál.

    Vytvořil Rostelecom. V současné době je ve fázi testování.

    Oficiální webová stránka je www.sputnik.ru.

    Metabot je vyvíjející se vyhledávač.

    Úkolem Metabotu je vytvořit vyhledávač pro všechny ostatní vyhledávače, vytvářet pozice pro vydávání výsledků s přihlédnutím k údajům celého seznamu vyhledávačů. To znamená, že je to vyhledávač pro vyhledávače.

    Oficiální stránka je www.metabot.ru.

    Vyhledávač byl pozastaven.

    Oficiální stránka je www.turtle.ru.

    KM - multiportál.

    Zpočátku byly stránky multiportálem s následným zavedením vyhledávače. Vyhledávání lze provádět jak v rámci webu, tak na všech sledovaných webech Runet.

    Oficiální stránka je www.km.ru.

    Gogo - nefunguje, přesměruje na vyhledávač.

    Oficiální stránka je www.gogo.ru.

    Ruský multiportál, který není příliš populární, potřebuje vylepšit. Vyhledávač obsahuje zprávy, TV, hry, mapu.

    Oficiální stránka je www.zoneru.org.

    Vyhledávač nefunguje, vývojáři navrhují použít vyhledávač.

    Dlouho se staly nedílnou součástí ruského internetu. Vyhledávače jsou dnes obrovské a složité mechanismy, které jsou nejen nástrojem pro vyhledávání informací, ale také lákavými oblastmi pro podnikání.

    Většina uživatelů vyhledávačů nikdy nepřemýšlela (nebo nepřemýšlela, ale nenašla odpověď) o principu fungování vyhledávačů, o schématu zpracování požadavků uživatelů, o tom, z čeho se tyto systémy skládají a jak fungují ...

    Tato hlavní třída je navržena tak, aby odpověděla na otázku, jak fungují vyhledávače. Nenajdete zde však faktory ovlivňující pořadí dokumentů. Navíc s tím nepočítejte podrobné vysvětlení Algoritmus Yandex. Podle Ilya Segaloviče, ředitele technologie a vývoje vyhledávače Yandex, může být rozpoznán pouze „při mučení“ samotným Ilyou Segalovičem ...

    2. Koncepce a funkce vyhledávače

    Vyhledávač je softwarový a hardwarový systém určený k prohledávání internetu a odpovídání na požadavek uživatele, specifikovaný ve formě textové fráze (vyhledávací dotaz), vydáním seznamu odkazů na informační zdroje v pořadí podle relevance (v v souladu s žádostí). Největší mezinárodní vyhledávače: Google, Yahoo , MSN . V ruském internetu je to Yandex, Rambler, Aport.

    Podívejme se podrobněji na koncept vyhledávacího dotazu pomocí vyhledávače Yandex jako příklad. Vyhledávací dotaz by měl uživatel formulovat v souladu s tím, co chce najít, co nejstručněji a nejjednodušeji. Řekněme, že chceme v Yandexu najít informace o tom, jak si vybrat auto. Za tímto účelem otevíráme domovská stránka"Yandex" a zadejte text vyhledávacího dotazu "jak si vybrat auto." Dále je naším úkolem otevřít na naši žádost poskytnuté odkazy na zdroje informací na internetu. Je však docela možné, že potřebné informace nenajdeme. Pokud k tomu došlo, musíte buď svůj požadavek přeformulovat, nebo databáze vyhledávače skutečně nemá žádné relevantní informace o našem požadavku (to se může stát při nastavení velmi „úzkých“ dotazů, jako například „jak si vybrat auto v Archangelsku “)

    Primárním cílem každého vyhledávače je poskytnout přesně ty informace, které hledají. A naučit uživatele zadávat „správné“ požadavky do systému, tzn. požadavky, které odpovídají zásadám fungování vyhledávačů, nejsou možné. Vývojáři proto vytvářejí takové algoritmy a principy fungování vyhledávačů, které uživatelům umožní najít informace, které hledají.

    To znamená, že vyhledávač musí „myslet“ stejně jako uživatel při vyhledávání informací. Když uživatel zadá požadavek do vyhledávače, chce co nejrychleji a nejjednodušeji najít to, co potřebuje. Po obdržení výsledku vyhodnotí výkon systému podle několika základních parametrů. Našel, co hledal? Pokud nebyl nalezen, kolikrát musel dotaz přeformulovat, aby našel, co hledal? Jak aktuální informace mohl najít? Jak rychle vyhledávač zpracoval dotaz? Jak pohodlné byly zobrazeny výsledky vyhledávání? Byl požadovaný výsledek první nebo stý? Jak moc zbytečné odpadky byl nalezen spolu s užitečné informace? Budou požadované informace nalezeny při přístupu do vyhledávače řekněme za týden nebo za měsíc?

    Aby vývojáři vyhledávačů uspokojili všechny tyto otázky odpověďmi, neustále zlepšují vyhledávací algoritmy a principy, přidávají nové funkce a schopnosti a snaží se všemi možnými způsoby zrychlit systém.

    3. Hlavní charakteristiky vyhledávače

    Pojďme si popsat hlavní charakteristiky vyhledávačů:

    • úplnost

      Úplnost je jednou z hlavních charakteristik vyhledávače, což je poměr počtu dokumentů nalezených na vyžádání k celkovému počtu dokumentů na internetu, které vyhovují tento požadavek. Pokud je například na internetu 100 stránek obsahujících frázi „jak si vybrat auto“ a pouze 60 z nich bylo nalezeno pro odpovídající dotaz, bude vyvolání vyhledávání 0,6. Je zřejmé, že co úplnější vyhledávání, tím menší je pravděpodobnost, že uživatel nenajde dokument, který potřebuje, za předpokladu, že na internetu vůbec existuje.

    • Přesnost

      Přesnost je další hlavní charakteristikou vyhledávače, která je dána mírou, do jaké se nalezené dokumenty shodují s dotazem uživatele. Pokud například dotaz „jak vybrat auto“ obsahuje 100 dokumentů, 50 z nich obsahuje frázi „jak si vybrat auto“ a zbytek jednoduše obsahuje tato slova („jak vybrat správné rádio a nainstalovat jej do auto“), pak se přesnost vyhledávání považuje za rovnou 50/100 (=0,5). Čím přesnější je vyhledávání, tím rychleji uživatel najde potřebné dokumenty, tím méně různých druhů „odpadků“ mezi nimi najde, tím méně často nalezené dokumenty nebudou odpovídat požadavku.

    • Relevantnost

      Neméně důležitou složkou vyhledávání je relevance, která je charakterizována dobou, která uplyne od okamžiku zveřejnění dokumentů na internetu do jejich zadání do indexové databáze vyhledávače. Například den poté, co se objevila zajímavá zpráva, velký počet uživatelé se obrátili na vyhledávače s relevantními dotazy. Objektivně neuplynul ani den od zveřejnění zpravodajských informací na toto téma, nicméně hlavní dokumenty již byly indexovány a vyhledávány díky existenci tzv. „rychlé základny“ velkých vyhledávačů, což je aktualizovány několikrát denně.

    • Rychlost vyhledávání

      Rychlost vyhledávání úzce souvisí s jeho tolerancí zatížení. Například podle OOO Rambler Internet Holding dnes během pracovní doby přichází do vyhledávače Rambler asi 60 požadavků za sekundu. Taková pracovní zátěž vyžaduje zkrácení doby zpracování jednoho požadavku. Zde se zájmy uživatele a vyhledávače shodují: návštěvník chce získat výsledky co nejrychleji a vyhledávač musí požadavek zpracovat co nejrychleji, aby nezpomaloval výpočet dalších požadavků.

    • viditelnost

    4. Krátký příběh vývoj vyhledávačů

    V počátečním období rozvoje internetu byl počet jeho uživatelů malý a objem dostupné informace relativně malý. Přístup k internetu měli většinou pouze výzkumní pracovníci. V té době nebyl úkol vyhledávat informace na internetu tak aktuální jako nyní.

    Jeden z prvních způsobů, jak uspořádat přístup k informační zdroje sítě bylo vytváření otevřených adresářů stránek, odkazů na zdroje, ve kterých byly seskupeny podle předmětu. Prvním takovým projektem byl Yahoo.com, který byl otevřen na jaře roku 1994. Poté, co se počet stránek v adresáři výrazně zvýšil, byla přidána možnost vyhledávání nezbytné informace podle katalogu. V plném smyslu to ještě nebyl vyhledávač, protože rozsah vyhledávání byl omezen pouze na zdroje v adresáři a ne na všechny internetové zdroje.

    Adresáře odkazů byly v minulosti široce používány, ale v současné době téměř úplně ztratily svou popularitu. Protože i moderní, obrovské katalogy obsahují informace jen o zanedbatelné části internetu. Největší síťový adresář DMOZ (také nazývaný Open Directory Project) obsahuje informace o 5 milionech zdrojů, zatímco vyhledávací základna systémy Google obsahuje více než 8 miliard dokumentů.

    V roce 1995 se objevily vyhledávače Lycos a AltaVista. Poslední jmenovaný je již řadu let lídrem v oblasti vyhledávání informací na internetu.

    V roce 1997 vytvořili Sergey Brin a Larry Page vyhledávač Google jako součást výzkumného projektu na Stanfordské univerzitě. Google je v současnosti nejpopulárnější vyhledávač na světě!

    V září 1997 byl vyhledávač oficiálně vyhlášen. Systém Yandex, který je nejoblíbenější na rusky mluvícím internetu.

    V současné době existují tři hlavní vyhledávače (mezinárodní) – Google, Yahoo a have vlastní základny a vyhledávacích algoritmů. Většina ostatních vyhledávačů (kterých je velké množství) používá výsledky tří uvedených v té či oné podobě. Například vyhledávání AOL (search.aol.com) používá Google, zatímco AltaVista, Lycos a AllTheWeb používá Yahoo.

    5. Složení a principy vyhledávače

    V Rusku je hlavním vyhledávačem Yandex, dále - Rambler.ru, Google.ru, Aport.ru, Mail.ru. V současné době navíc Mail.ru používá vyhledávač a databázi Yandex.

    Téměř všechny velké vyhledávače mají svou vlastní strukturu, odlišnou od ostatních. Je však možné vyčlenit hlavní součásti společné všem vyhledávačům. Rozdíly ve struktuře mohou být pouze ve formě implementace mechanismů interakce těchto složek.

    Indexovací modul

    Indexovací modul se skládá ze tří pomocné programy(roboty):

    Spider (pavouk) - program určený ke stahování webových stránek. "Pavouk" stáhne stránku a extrahuje všechny interní odkazy z této stránky. Stáhne se html kód každé stránky. Roboti používají ke stahování stránek HTTP protokoly. "pavouk" funguje následovně. Robot odešle na server požadavek „get/path/document“ a některé další příkazy HTTP požadavku. V reakci na to robot obdrží textový proud obsahující servisní informace a samotný dokument.

    • URL stránky
    • datum stažení stránky
    • HTTP hlavička odpovědi serveru
    • tělo stránky (html kód)

    Crawler ("cestující" pavouk) - program, který automaticky sleduje všechny odkazy nalezené na stránce. Vybere všechny odkazy na stránce. Jeho úkolem je na základě odkazů nebo na základě předem definovaného seznamu adres určit, kam se má pavouk dále vydat. Crawler podle nalezených odkazů vyhledává nové dokumenty, které vyhledávač dosud nezná.

    Indexer (robot-indexer) - program, který analyzuje webové stránky stažené pavouky. Indexátor analyzuje stránku na jednotlivé části a analyzuje je pomocí vlastních lexikálních a morfologických algoritmů. Jsou analyzovány různé prvky stránky, jako je text, nadpisy, odkazy, strukturální a stylové prvky, speciální servisní html tagy atd.

    Modul indexování vám tedy umožňuje procházet danou sadu zdrojů pomocí odkazů, stahovat nalezené stránky, extrahovat odkazy na nové stránky z přijatých dokumentů a provádět kompletní analýza tyto dokumenty.

    Databáze

    Databáze nebo index vyhledávače je systém ukládání dat, pole informací, které ukládá speciálně převedené parametry všech dokumentů stažených a zpracovaných indexovacím modulem.

    vyhledávací server

    Vyhledávací server je základní prvek celého systému, protože kvalita a rychlost vyhledávání přímo závisí na algoritmech, které jsou základem jeho fungování.

    Vyhledávací server funguje takto:

    • Požadavek přijatý od uživatele je podroben morfologické analýze. Vygeneruje se informační prostředí každého dokumentu obsaženého v databázi (který se následně zobrazí ve formuláři , tedy odpovídajícím požadavku textové informace na stránce s výsledky vyhledávání).
    • Přijatá data jsou předávána jako vstupní parametry speciálnímu hodnotícímu modulu. Data se zpracovávají pro všechny dokumenty, v důsledku toho je pro každý dokument vypočítáno jeho vlastní hodnocení, charakterizující relevanci dotazu zadaného uživatelem, a různé součásti tohoto dokumentu uložené v indexu vyhledávače.
    • V závislosti na volbě uživatele lze toto hodnocení upravit dalšími podmínkami (například tzv. „pokročilé vyhledávání“).
    • Dále se vygeneruje úryvek, to znamená pro každý nalezený dokument se z tabulky dokumentu extrahuje nadpis, stručná anotace, která nejlépe odpovídá dotazu, a odkaz na samotný dokument a nalezená slova se zvýrazní.
    • Přijaté výsledky vyhledávání jsou předávány uživateli ve formě SERP (Search Engine Result Page) - stránka pro vydávání výsledků vyhledávání.

    Jak vidíte, všechny tyto komponenty spolu úzce souvisejí a fungují v interakci a tvoří jasný, poměrně složitý mechanismus pro vyhledávač, který vyžaduje obrovské množství zdrojů.

    6. Závěr

    Nyní si shrňme vše výše uvedené.

    • Primárním cílem každého vyhledávače je poskytnout přesně ty informace, které hledají.
    • Hlavní vlastnosti vyhledávačů:
      1. úplnost
      2. Přesnost
      3. Relevantnost
      4. Rychlost vyhledávání
      5. viditelnost
    • Prvním plnohodnotným vyhledávačem byl projekt WebCrawler, který vyšel v roce 1994.
    • Vyhledávač obsahuje následující součásti:
      1. Indexovací modul
      2. Databáze
      3. vyhledávací server

    Doufáme, že naše mistrovská třída vám umožní lépe se seznámit s konceptem PS, lépe porozumět hlavním funkcím, vlastnostem a principům fungování vyhledávačů.

    Většina populární web Služba dnešní doby je vyhledávač. Vše je zde pochopitelné, protože doby, kdy zástupci prvních uživatelů internetu mohli pozorovat nové položky v síti, jsou dávno pryč.

    Objevuje se a hromadí se tolik informací, že je pro člověka velmi obtížné najít přesně tu, kterou by potřeboval. Představte si, jaké by to bylo hledat na internetu, kdyby běžný uživatel musel hledat informace, kterým nerozumím kde. Nechápu přesně kde, protože ručním vyhledáváním mnoho informací nenajdete.

    Vyhledávač, co to je?

    Je dobré, když uživatel již zná stránky, které mohou mít potřebné informace, ale co jiného dělat? Aby člověk usnadnil život při hledání potřebných informací na internetu, byly vynalezeny vyhledávače nebo jednoduše vyhledávače. Vyhledávač provádí jeden velmi důležitou funkci, bez kterého by internet nebyl takový, jak jsme na něj zvyklí – to je vyhledávání informací na síti.

    Vyhledávací systém- jedná se o speciální web nebo jinými slovy web, který uživatelům na jejich žádost poskytuje hypertextové odkazy na stránky, weby, které odpovídají na daný vyhledávací dotaz.

    Abychom byli trochu přesnější, jde o vyhledávání informací na internetu, které probíhá díky softwarové a hardwarové funkční sadě a webovému rozhraní pro interakci s uživateli.

    Pro interakci člověka s vyhledávačem bylo vytvořeno webové rozhraní, tedy viditelná a srozumitelná skořápka. Tento přístup vývojářů vyhledávačů usnadňuje hledání mnoha lidem. Zpravidla se pomocí vyhledávačů vyhledává internet, ale existují i ​​vyhledávače FTP serverů, určitých druhů zboží v Celosvětová Síť nebo informace o novinkách nebo jiné cíle hledání.

    Vyhledávání lze provádět nejen na textovém obsahu stránek, ale také na jiných typech informací, které může člověk vyhledávat: obrázky, videa, zvukové soubory atd.

    Jak probíhá vyhledávání pomocí vyhledávače?

    Samotné vyhledávání na internetu, stejně jako prohlížení webových stránek, je možné pomocí internetového prohlížeče - prohlížeče. Teprve poté, co uživatel nastaví svůj dotaz do vyhledávací lišty, probíhá přímo samotné vyhledávání.

    Každý vyhledávač obsahuje softwarová část, na kterém je celý vyhledávač založen, se nazývá vyhledávač - jedná se o softwarový balík, který poskytuje možnost vyhledávat informace. Po kontaktování vyhledávače, vytvoření vyhledávacího dotazu osobou a jeho zadání do vyhledávacího pole vyhledávač vygeneruje stránku se seznamem výsledků vyhledávání, z nichž nejrelevantnější jsou podle vyhledávače umístěny výše.

    Relevance vyhledávání – vyhledávání nejrelevantnějších materiálů k požadavku uživatele a umístění hypertextových odkazů na ně na stránce s výsledky vyhledávání s přesnějšími výsledky nad ostatními. Samotné rozložení výsledků se nazývá hodnocení stránek.

    Jak tedy vyhledávač připravuje podklady k vydání a jak vyhledávač informace vyhledává? Sběr informací na síti usnadňuje robot jedinečný pro každý vyhledávač nebo jiným způsobem bot, který má i řadu dalších synonym jako crawler nebo pavouk a samotný chod vyhledávacího systému lze rozdělit do tří fází:

    První fázi práce vyhledávače lze připsat skenování stránek v globální síť a sbírka na vašem vlastní servery kopie webových stránek. To tvoří obrovské množství informací, které ještě nebyly zpracovány a nejsou vhodné pro výsledky vyhledávání.

    Druhá fáze práce vyhledávače se omezuje na uspořádání informací získaných dříve, v první fázi, ze stránek. Provádí se takové třídění, které v co nejkratším čase zvýhodní velmi kvalitní vyhledávání, které uživatelé od vyhledávače skutečně očekávají. Fáze se nazývá indexace, což znamená, že stránky jsou již připraveny k vydání a aktuální databáze bude považována za index.

    Je to třetí fáze, která určuje výsledky vyhledávání po obdržení požadavku od vašeho klienta na základě klíčových slov nebo v blízkosti klíčových slov uvedených v požadavku. To přispívá k výběru nejrelevantnějších informací k žádosti a jejímu následnému vystavení. Protože existuje mnoho informací, vyhledávač provádí hodnocení v souladu se svými algoritmy.
    Nejlepší vyhledávač je ten, který dokáže poskytnout materiál, který nejsprávněji odpovídá na požadavek uživatele. Ale i zde mohou být výsledky ovlivněné lidmi se zájmem o propagaci svých stránek, takové stránky, i když ne vždy, se ve výsledcích vyhledávání často objevují, ale ne na dlouho.

    Přestože v mnoha regionech již byli identifikováni světoví lídři, vyhledávače nadále rozvíjejí své kvalitní vyhledávání. Čím lepší vyhledávání mohou poskytnout, tím více lidí využijí to.

    Jak používat vyhledávač?

    Co je vyhledávač a jak funguje je již jasné, ale jak jej správně používat? Většina webů má vždy vyhledávací panel a vedle něj je tlačítko Najít nebo Hledat. Do vyhledávací lišty se zadá dotaz, po kterém je třeba stisknout tlačítko vyhledávání nebo, jak to často bývá, stisknout klávesu Enter na klávesnici a během několika sekund obdržíte výsledek dotazu ve formuláři seznamu.

    Ale získat správnou odpověď na vyhledávací dotaz není vždy možné napoprvé. Aby se hledání toho, co chcete, nestalo bolestným, musíte správně sestavit vyhledávací dotaz a řídit se níže popsanými doporučeními.

    Sestavte vyhledávací dotaz správně

    Následuje několik tipů pro používání vyhledávače. Dodržování některých triků a pravidel při hledání informací ve vyhledávači poskytne příležitost k získání kýžený výsledek mnohem rychlejší. Postupujte podle těchto pokynů:

    1. Správný pravopis slov poskytuje maximální počet shod s požadovaným informační objekt(Přestože se moderní vyhledávače již naučily opravovat pravopisné chyby, tato rada by neměla být opomíjena).
    2. Použitím synonym v dotazu lze pokrýt širší rozsah vyhledávání.
    3. Někdy může změna slova v textu dotazu přinést lepší výsledek, proto dotaz přeformulujte.
    4. Vneste do dotazu specifičnost, používejte přesné výskyty frází, které by měly určovat hlavní podstatu vyhledávání.
    5. Experimentujte s klíčovými slovy. Používání klíčová slova a fráze mohou pomoci určit hlavní bod a vyhledávač vrátí relevantnější výsledek.

    Co je tedy vyhledávač - to není nic jiného než příležitost najít zajímavé informace a obvykle je zcela zdarma použít, něco se naučit, něčemu porozumět nebo si udělat správný závěr pro sebe. Mnozí si už svůj život bez něj nedokážou představit hlasové vyhledávání, do kterého se text nemusí psát, stačí říct svůj požadavek a vstupním zařízením je zde mikrofon. To vše svědčí o neustálém rozvoji vyhledávacích technologií na internetu a jejich potřebě.

    Google se podle očekávání umístil na prvním místě světového žebříčku. To odpovídá přes 70 % vyhledávací dotazy od lidí z celého světa. Navíc třetina veškeré návštěvnosti google.com pochází od občanů USA. Google je navíc nejnavštěvovanější web na světě. Průměrná denní doba používání vyhledávače Google je 9 minut.

    Výhodou vyhledávače Google je absence extra prvky Na stránce. Pouze vyhledávací lišta a logo společnosti. Čip jsou animované obrázky a prohlížečové hry věnované oblíbeným a místním svátkům.

    2. Bing

    Bing - vyhledávač od společnosti Microsoft vede svou historii od roku 2009. Od té doby se stal povinným atributem smartphonů se systémem Windows. Bing se také vyznačuje minimalismem – kromě záhlaví se seznamem všech produkty společnosti Microsoft, stránka obsahuje pouze vyhledávací řetězec a název systému. Bing je nejoblíbenější v USA (31 %), Číně (18 %) a Německu (6 %).

    3 Yahoo!

    Třetí místo bylo přiděleno jednomu z nejstarších vyhledávačů – Yahoo. Většina uživatelů také žije v USA (24 %). Člověk má dojem, že zbytek světa se pomoci vyhledávacích robotů záměrně vyhýbá... Vyhledávač je také populární v Indii, Indonésii, na Tchaj-wanu a ve Spojeném království. Kromě vyhledávací lišty na Yahoo! nabízí předpověď počasí pro vaši oblast a také světové trendy ve formě zpravodajství.

    4. Baidu

    Čínský vyhledávač, který se proslavil v Rusku. Vzhledem k agresivní politice a chybějícímu překladu do ruštiny resp anglické jazyky, jsou rozšíření tohoto vyhledávače vnímána jako viry. Je velmi obtížné je úplně odstranit a zbavit se vyskakovacích oken s hieroglyfy. Tento web však ano čtvrtý na světě podle docházky. 92 % jeho publika jsou čínští občané.

    5. AOL

    AOL je americký vyhledávač, jehož jméno je zkratkou pro America Online. Jeho popularita je mnohem nižší než u předchozí systémy. Jeho úsvit byl v 90. a 00. letech 20. století. Téměř 70 % publika AOL je ze Spojených států.

    6 Ask.com

    Tento vyhledávač, jehož historie sahá až do roku 1995, má docela neobvyklé rozhraní. Všechny požadavky vnímá jako otázky a nabízí odpovědi v souladu s Výsledky vyhledávání. Trochu to připomíná službu Answers.Mail. Do problematiky se však nedostávají ohlasy amatérů, ale plnohodnotné články. Za poslední rok ztratila stránka asi 50 pozic ve světovém žebříčku nejpopulárnějších internetových zdrojů a dnes zaujímá pouze 104. místo.

    7. Vzrušovat

    Tento vyhledávač není pozoruhodný a vypadá jako mnoho jiných stránek. Uživatelům nabízí spoustu služeb (jako jsou Zprávy, Mail, Počasí, Cestování atd.) Rozhraní stránek také evokuje web 90. let a dalo by se předpokládat, že se od té doby změnilo jen málo.

    8. DuckDuckGo

    Vývojáři okamžitě varují, že tento vyhledávač nesleduje vaše aktivity online. V dnešní době je to těžký argument při výběru vyhledávače. Design stránek je vyroben moderním způsobem, používá světlé barvy a vtipné obrázky. Na rozdíl od jiných vyhledávačů je „kachní vyhledávač“ přeložen do ruštiny. Za poslední rok získal web zpět asi 400 pozic a v březnu 2017. je na 504. řádku hodnocení oblíbenosti Alexa.

    9 WolframAlpha

    Charakteristickým rysem tohoto vyhledávání je rozmanitost pomocných služeb určených pro dotazy týkající se určitých znalostí. To znamená, že v čísle neuvidíte odkazy na příspěvky na sociálních sítích ani články žlutého tisku. Bude vám nabídnuto konkrétní postavy a ověřená fakta ve formě jednoho dokumentu. Tento prohlížeč je ideální pro školáky a studenty.

    10. Yandex

    Vyhledávač, nejoblíbenější v Rusku a zemích SNS. Navíc asi 3 % publika webu tvoří obyvatelé Německa. Stránka se vyznačuje velkým množstvím služeb pro všechny příležitosti (hudba, rádio, rozvrh veřejná doprava, nemovitosti, překladatel atd.) Zdroj také nabízí velký výběr individuálního designu webových stránek a také přizpůsobení widgetů. Yandex je na 31. místě na světě z hlediska popularity, když za poslední rok ztratil 11 pozic.