SVĚTOVÉ REŠERŠNÍ SYSTÉMY WWW SVĚTOVÉ METAREŠERŠNÍ SYSTÉMY WWW SVĚTOVÉ KATALOGY / INDEXY WWW
ČESKÉ KATALOGY A REŠERŠNÍ SYSTÉMY WWW MANUÁL V ČEŠTINĚ KNIHOVNICKO-INFORMAČNÍ WEB

Světové rešeršní systémy WWW
3 + 2 + 2 Top Search Engines

[Aktualizace: 07. 10. 2003]

GOOGLE No. 1: GOOGLE - jeden z nejúspěšnějších současných rešeršních systémů webu společnosti "Google Inc." (Palo Alto, California, USA, založ. v r. 1998); mnohonásobný vítěz hodnocení vyhledávacích systémů na WWW za rok 2002 udělované společností "Search Engine Watch"; systém vznikl na Stanford University v Berkeley; v systému, který zahrnuje i vlastního robota "Crawlera", je v současnosti indexováno (dle deklarace z domovské stránky) cca 3.300.000.000 webovských stránek z povrchového webu (včetne PDF souborů); celá množina ovšem zahrnuje i stránky, citované dokumenty, které Google indexuje jako základní; v tuto chvíli jde o úplně největší počet registrovaných stránek; specifikem celé architektury systému je analýza hyperodkazů webovských stránek (odkazy směřované NA stránku i ZE stránky) a jejich zpracování pro potřeby vyhledávání; jediným hlediskem pro řazení nalezených dokumentů je výpočet významnosti (míry relevence) stránky - tzv. "PageRank", v něž se kalkulují pravě jenom hyperodkazy, což může být zrádné v mnoha případech tematických rešerší; automatická detekce frází; specifika výstupních informací, klastrování výsledných záznamů z jednoho serveru do odstavců pod základní nejrelevantnější záznam; od září 1999 zprovoznění vyhledávání podobných záznamů (Similar Pages) (na základě vektorového modelu) ze záznamů výsledné rešerše pomocí technologie "GoogleScout"; HELP v angličtině ** Novinka: vyhledávání informací podle tematických kategorií (directory) je smluvně zajištěno přes systém předmětového katalogu The Open Directory Project (v celkovém objemu asi 1.500.000 URL webovských sídel)
ATWEB No. 2: AllTheWeb - úspěšný vyhledávací systém, založený v r. 1999; co do objemu indexu jeden z největších a velmi rychlých rešeršních systémů webu v současnosti; velký konkurent systému Google; náleží norské firmě Fast Search & Transfer ASA (FAST) (Oslo a Trondheim, Norsko, založ. v r. 1997); americká filiálka Fast Search & Transfer, Inc. sídlí v Westborough, MA; v únoru 2003 ohlášen záměr prodeje vyhledávacího systému FAST společností OVERTURE Services, Inc. (bývalý Go To); v současnosti systém deklaruje indexovaných cca 3.200.000.000 stránek; vyhledávací systém "All the Web - All the Time" je provozován na paralelně pracujících serverech počítačové firmy Dell Computer Corporation (servery Dell PoverEdge a ukládací subsystémy Dell PowerVault); rychlá tvorba indexu (12 hodin); vlastní FAST Web Crawler; vyhledávání podle klíčových slov i podle frází (užívání jednoduché interpunkce + - a " "); specifický algoritmus pro řazení záznamů ve výsledné rešerši; návazné vyhledávání dokumentů z FTP archivů přes systém FTP Search firmy Lycos Inc.; vyhledávání zvukových zdrojů rovněž přes MP3 Search systém firmy Lycos Inc. ** HELP dotazovacího jazyka v angličtině
HotBot

Inctomi Corporation

No. 3: HOTBOT - úspěšný a výkonný rešeršní systém WWW; jde o vyhledávací službu provozovanou firmou Wired Digital Inc. (v říjnu 1998 byla odkoupena společností Lycos); systém využívá indexů jiných systémů nebo společností: FAST, GOOGLE, INKTOMI a zejména nového zajímavého systému TEOMA; patentovaná technologie "Inktomi Search Engine" je licencována i v jiných systémech; HotBot se stále drží na předních pozicích v různých žebříčcích hodnocení; jednoduché, komfortní rychlé a velmi sofistikované rešeršní techniky (slova i fráze + hledání v polích) s pozoruhodnými výsledky; systém v rámci indexi FAST automaticky klastruje nalezené záznamy ("More results from this site"); obohacování výsledků vyhledávání zajišťované technologií systému/společnosti TEOMA viz ("Try resources"); v současné chvíli solidní design grafického rozhraní pro jednoduché i pokročilé vyhledávání
TEOMA/ASK JEEVES No. 4: TEOMA - nový rešeršní systém WWW, který vytvořil expertní tým P. Gardiho, A. Gerasoulise a Tao Yanga; vznikl v dubnu 2000, zprovozněn byl v dubnu 2001; v září 2001 je systém stal akvizicí společnosti ASK JEEVES, Inc.; na počátku roku 2003 byla uvedena nová verze systému (Teoma 2.0); novinkou ve vyhledávání tohoto systému je jednak dynamické řazení nalezených záznamů, zejména však řazení založené na výpočtu popularity stránek z hlediska předmětového (Subject-Specific PopularitySM)
Alta Vista

CMGI

No. 5: ALTA VISTA SEARCH - stále kvalitní rešeršní systém Webu; založen v roce 1995 firmou Digital Equipment Corporation ; v r. 1998 jej odkoupila společnost Compaq Computer Corporation; 30. 6. 1999 odkoupila 85% akcií internetová společnost CMGI, Inc. (15 % zůstává CCC); v únoru 2003 ohlášen prodej Alta Visty společnosti OVERTURE Services, Inc. (bývalý Go TO); vedle webu zahrnuje i síť Usenet; zjišťování a získávání informací pomocí vlastního robota "Scooter" (zhruba 6 milionů dokumentů denně); indexaci celého dokumentu (každá stránka, každé slovo) včetně URL zajišťuje program "NI2" (na AlphaServeru 4100 5/300), podpora metatagů; k 20.1. 2003 asi 1.000.000.000 indexovaných dokumentů; vlastní vyhledávací proces je provozován na 16 výkonných AlphaServerech 8400 5/440 (každý s 12 procesory, 8 GB RAM a sada HD s kapacitou 300 GB); bohaté rešeršní techniky přes slova i fráze, hledání v polích v rámci jednoduchého i pokročilého vyhledávání, druhý způsob však postrádá grafické rozhraní, které by vedlo k snazší formulaci dotazů; automatická detekce frází; automatická kontrola zápisu slov zajišťovaná technologií společnosti TeraGram; komfortní zpřesňování dotazů přes funkci "Others searched for" (odkazy uvedeny pod formulací dotazu); vylučování duplicitních a neplatných odkazů ** Obohacení vyhledávání o informace ze systému Ask Jeeves ** Unikátní vyhledávání obrazových a zvukových informací "AV Photo &Media Finder" ** Vyhledávání informací podle tematických kategorií je smluvně zajištěno přes systémy předmětových katalogů Open Directory a "LookSmart (v celkovém výsledném objemu asi 2.000.000 webovských sídel) ** Možnost filtrace nevhodných informací v rámci systému AV Family Filter ** ! ** HELP v angličtině
Lycos No. 6: LYCOS - "katalog" Internetu společnosti Lycos Incorporated., (Marlboro, Mass., USA, založ 1994); podporován Carnegie Mellon University; konkurenční rešeršní systém Alta Visty; od října 1998, kdy Lycos zakoupil Wired Digital, je systém provozován na bázi technologie "Inktomi Search Engine" (viz systém HotBot); v současnosti v bázi zhruba 50.000.000 URL; jednodušší rešeršní techniky (jen podle slov, nikoliv frázi), ale také nižší účinnost; automatické pravostranné rozšiřování hledaných slov (automatická lemmatizace - steeming);zahrnuje německé a švédské zrcadlo Lycosu; zatížení reklamou je značné a vadí při rešeršování! ** V dubnu 1999 Lycos jako "search engine" zahájil kuriózní transformaci na předmětový adresář Internetu (s částčně intelektuálně zpracovávanými stránkami) ** HELP v angličtině
AskJeeves No. 7: ASK JEEVES! - rešeršní systém Webu stejnojmenné firmy Ask Jeeves, Inc. (Berkeley, California, USA, v provozu od r. 1998); impozantní vyhledávací systém založený na principu "otázka-odpověď" (uživatel je veden ke zpřesňování dotazu pomocí systémem kladených otázek); využívá jednak technologie pro zpracování přirozeného jazyka a jednak báze znalostí , kterou buduje zhruba 30 pracovníků (v současné chvíli obsahuje asi 7.000.000 otázek, připojovaných k vybraným zjištěným webovským dokumentům s příslušnou odpovědí); výsledky vyhledávání (prezentované v interaktivní tabulkové formě), které představují vysokou míru relevance, jsou obohacovány i o odkazy na dílčí rešerše vykonané v řadě partnerských vyhledávacích systémů (Alta Vista, Infoseek, WebCrawler, Excite aj.); systém kontroluje správnost zápisu anglických slov; technologie systému je využívána i v rámci systému Alta Vista; HELP systému v angličtině


[ Světové rešeršní systémy WWW ] | [ Světové metarešeršní systémy WWW ] | [ Světové katalogy WWW ]
[ České katalogy a rešeršní systémy WWW ] | [ Manuál ] | [ Knihovnicko-informační web ]

[ Analýzy a hodnocení SE ] | [ Srovnání vlastností SE ] Search Engine Watch [ Velikost databází SE ] | [ Vlastnosti SE ] |

[ Search Engine Report Newsletter (časopis) ] | [ SearchDay Newsletter (časopis) ]


Copyright © Eva Bratková, 1995-2003
Created: 1995-10-20 * Updated: 2003-10-06