Spravodajstvo

Pozrite sa, ako funguje vyhľadávanie informácií na webe prostredníctvom Google vyhľadávača

Ako pracuje Google pri zobrazovaní výsledkov vyhľadávaní a ako vlastne vie, kde sa nachádza vyhľadávaný dotaz?

Ako funguje vyhľadávanie prostredníctvom Google? Ako je možné, že hoci majú webové stránky rovnaký obsah, tak jedna stránka sa zobrazí vyššie a druhá zas nižšie? Ako Google vie, kde nájdeme to, čo hľadáme? Tak to sú otázky, ktoré si už bezpochyby povedali už mnohí z nás. Spoločnosť Google prostredníctvom svojej stránkyAko funguje Vyhľadávanie Google“, na ne odpovedá.

Milióny možných výsledkov vyhľadávaní

Hneď v úvode treba povedať, že pri každom výsledku vyhľadávanie existujú tisíce, ak nie milióny možných výsledkov vyhľadávania. Avšak samotné výsledky vyhľadávania začínajú ďaleko pred fyzickým vyhľadaním dotazu. Začnime však po poriadku.

Čo to Google vlastne je?

Pre mnohých z nás Google je internetový vyhľadávač, kde keď dačo zadáme tak to vyhľadá, a ďalej sa nad samotným procesom vyhľadávania nezamýšľame. Google však môžeme charakterizovať skôr ako obrovskú knižnicu stránok, resp. systém, ktorý zoraďuje, vyhľadáva a ukladá internetové stránky. Tento proces sa volá indexovanie zoznamu webových stránok (častokrát sa označuje ako „Spiders web“). Tieto stránky do svojej databázy ukladá prostredníctvom takzvaných „Google robotov“. Môžete si pod nimi predstaviť „robotníkov“, ktorí prehľadávajú web a keď objavia novú stránku, tak ju zariadenia „do knižnice“.

„Proces indexového prehľadávania začína zoznamom webových adries z predchádzajúcich indexových prehľadávaní a máp webov poskytnutých vlastníkmi webových stránok. Keď naše indexové prehľadávače navštívia tieto weby, použijú odkazy na týchto stránkach na objavenie nových stránok…“ píše spoločnosť na svojich stránkach.

Ako fungujú algoritmy vyhľadávania?

Ako už asi tušíte, tak na internete existujú milióny stránok, ktoré môžu mať rovnaký alebo podobný obsah. Otázkou teda je, na základe čoho Google určuje, ktorý web zobrazí vyššie, a ktorý zas nie. Za týmto účelom má spoločnosť vytvorený hodnotiaci systém stránok, vďaka ktorému vie používateľovi naservírovať v priebehu pár zlomkov sekúnd relevantné výsledky vyhľadávania.

Tieto hodnotiace systémy slúžia na vytvorenie si obrazu o obsahu stránky a relevantnosti výsledku vyhľadávania. Môžete si pod tým predstaviť napríklad to, či v URL adrese sa nachádza vyhľadávaný dotaz, koľkokrát sa nachádza na stránke hľadaný výraz, či na stránke nájdeme aj synonymá, ako dlhý je text, či ide o stránku s pridanou hodnotou, alebo o „spamovú“ stránku a podobne.  Jedným z dôležitých hodnotiacich faktorov je napríklad aj to, koľko stránok odkazuje na daný web, a či ide o kvalitné odkazujúce stránky, alebo nie. V odbornej terminológii sa to volá „Page rank“. Vychádza z logiky, že ak veľa kvalitných tematických stránok odkazuje na nejaký článok, tak je vysoko pravdepodobné, že daný článok s hľadaným výrazom je kvalitný, a preto ho zobrazuje vyššie vo výsledkoch.

„Algoritmy Vyhľadávania posudzujú mnoho faktorov vrátane slov v dopyte, relevancie a použiteľnosti stránok, odbornosti zdrojov a vašej polohy a nastavení, aby vám poskytli tie najužitočnejšie informácie. Dôraz kladený na každý faktor závisí od povahy vášho dopytu. Čerstvosť obsahu má napríklad väčší význam pri odpovedaní na dopyty týkajúce sa aktuálnych spravodajských tém ako v prípade definícií zo slovníka…“ píše Google.

Okrem iného spoločnosť dopĺňa, že využíva aj tisíce hodnotiteľov obsahu naprieč internetom, ktorí sledujú a posudzujú, ako dobre určitý web  poskytuje informácie používateľom, ktorí na neho kliknú, hodnotia ďalej kvalitu výsledkov na základe odbornosti, spoľahlivosti, a dôveryhodnosti obsahu. Spoločnosť však dodáva, že tieto výsledky nemajú priamy vplyv na určovanie poriadia webov, ale skôr slúžia na to, aby vedeli porovnať kvalitu výsledkov vyhľadávania na základe algoritmov.

Analýza dopytov, ktoré zadávame do vyhľadávača

Spoločnosť ďalej prezrádza, že aby porozumeli vyhľadávaniu, a aby boli schopní doručiť kvalitný výsledok vyhľadávania, tak analyzujú význam slov vo vyhľadávacom dopyte. 

„Vytvárame jazykové modely, pomocou ktorých sa pokúšame dešifrovať, ktoré reťazce slov by sme mali hľadať v indexe.“

Jedným z najtypickejších príkladov analýzy týchto dopytov, sú gramatické chyby.

Google_ukazka analyzy slov
Zdroj: Vosveteit.sk

Google ďalej vysvetľuje, že sa snaží porozumieť tomu, aké informácie hľadáte. Chcete sa napríklad dozvedieť viac o produkte, prečítať si recenziu, alebo vás zaujímajú otváracie hodiny? Inými slovami, vytvára akési kategórie dopytov.

„Obzvlášť dôležitým aspektom tejto kategorizácie dopytov je analýza, či váš dopyt hľadá aktuálny obsah. Ak hľadáte populárne kľúčové slová, algoritmy aktuálnosti to interpretujú ako signál, že aktuálne informácie môžu byť užitočnejšie než staré stránky. Znamená to, že keď budete hľadať aktuálne „skóre zápasov NHL“, výsledky „Superstar“ alebo „zárobky exxonu“, zobrazia sa vám najnovšie informácie.“

Spájanie dotazov a možných výsledkov vyhľadávania

Spoločnosť následne spája tieto dve veci dokopy. Prvou je zadaný dotaz do vyhľadávača, kde sa snaží pochopiť to čo hľadáte, a potom výsledky vyhľadávania, ktoré zobrazuje na základe hodnotiacich faktorov, teda napríklad podľa autority stránky.

Spoločnosť v závere dodáva, že každý deň spracujú 15% dopytov, ktoré predtým ešte nevideli, a preto algoritmy vyhľadávania sú „živým organizmom“, na ktorom kontinuálne pracujú.

Prihláste sa do odberu tých najnovších informácií a správ z portálu VoSveteIt.sk

Odoslaním e-mailu dávate súhlas s podmienkami ochrany súkromia. Nezabudnite odber potvrdiť ešte v e-maile, ktorý Vám bude doručený

Mohlo by Vás zaujímať

Tagy

Martin Borko

Technológie ma fascinujú už niekoľko rokov a to hlavne spotrebná elektronika, ktorá nám dokáže častokrát zjednodušiť každodenné fungovanie. Zároveň však nepohrdnem ani futuristickými technológiami a víziami, o ktorých rád aj píšem.
Close
Close