Semalt: Kas yra „Googlebot“?



  1. Įvadas
  2. Kas yra „Googlebot“?
  3. Kodėl reikėtų susirūpinti „Googlebot“?
  4. Kodėl „Googlebot“ neaptinka visų kai kurių svetainių puslapių?
  5. Kaip optimizuoti svetainę, kad padidintumėte „Googlebot“ biudžetą
  6. Išvada

Įvadas

Ar žinote, kaip „Google“ randa išteklių jūsų paieškai? Kaip plačiai manoma, „Google“ nėra visa žinanti dvasia, kuri žino, kas yra kiekvienas internetinis turinys. Tai ne koks nors ekstrasensas, kuris žino, kur yra tikslus atsakymas į jūsų klausimą.

Kaip ir bet kuri kita paieškos sistema, ji turi programinę įrangą, kuri kiekvieną sekundę tikrina milijardus puslapių (ir svetainių), kad surinktų informaciją; išgauti turinio vertę ir jo temą. Taigi, kai atliekama paieška, iš tų puslapių gaunamas atsakymas - tarsi biblioteka.


Tai skamba kaip SEO, ir taip yra todėl, kad jis turi daug ką bendro. Kai svetainė yra efektyviai optimizuota, „Google“ greitai mato svetainę, perskaito jos puslapius ir parodo ją, kai paieškos sistemoje atliekamos susijusios paieškos.

Tačiau tai atsitinka ne visuose svetainės puslapiuose, sukuriant kai kuriuos puslapius nematomas į pasaulį. Kodėl taip atsitinka? O ką galima padaryti prieš tai (ypač labai svarbiems puslapiams)? Čia pateikiamas vadovas, kuriame išsamiai aprašoma visa informacija apie „Google“ svetainių tikrintuvą („Googlebot“), kodėl jis neskaito pakankamai puslapių ir kaip svetainės savininkas gali naudoti svetainės optimizavimą ir SEO, kad padidintų „Googlebot“ tikrinimo biudžetą.

Kas yra „Googlebot“?



Voras! Vikšrinis! Tai populiarūs „Googlebot“ pavadinimai. Taip yra todėl, kad jis veikia taip. Programinė įranga sukurta nuskaityti ir peržiūrėti milijardus visuomenei paskelbtų svetainių puslapių.

Teisingai - jei svetainė lieka privati, „Googlebot“ tiesiog negali nuskaityti jos puslapių, prisiminkite, kad voras nėra psichinis. Tai tiesiog seka puslapių nuorodas (iš vieno puslapio į kitą), tada tęsia duomenų apdorojimą. Kai tai bus baigta, informacija bus surenkama į rodyklę (lengvai įsimenama kaip „Goggle“ biblioteka ar parduotuvė).

Dėl šios programinės įrangos „Google“ gali surinkti ir sukaupti daugiau nei milijono gigabaitų (GB) informaciją per mažiau nei sekundę (gerai - dabar tai yra magija). Tada iš šio reguliariai atnaujinamo rodyklės „Google“ ištraukia išteklius kiekvienai paieškai internete tiek darbalaukyje, tiek mobiliajame įrenginyje.

Kodėl turėtumėte būti susirūpinę „Googlebot“?

„Googlebot“ tikrinimas turi daug bendro su svetainės SEO (optimizavimas paieškos sistemoms). Visa voratinklio esmė yra surinkti informaciją iš svetainės puslapių, kad atliekant paieškas susijusiomis temomis, jis galėtų rodyti puslapį kaip vieną iš internetinių paieškos rezultatų. Todėl, kai „Googlebot“ nuolat tikrina daugumą svetainės puslapių, padidės matomumas, dėl kurio padidės svetainės srautas tokiame puslapyje (o tai yra vienas iš tikslų?).

Naudokite šią iliustraciją:

X turi svetainę su puslapiu šia tema: profesionalus svetainių SEO. O Y ieško svetainės SEO. Jei „Googlebot“ peržiūrėjo X puslapį apie SEO ir jį indeksavo, tai būtų vienas iš rezultatų, pasirodžiusių „Google“ paieškos rezultatuose. Tas pats pasakytina ir apie kitas susijusias paieškas, net jei tai vyksta šimtą kartų per dieną visame pasaulyje.

Atminkite, kad yra ir kitų pabrėžiančių veiksnių, tokių kaip gera svetainės struktūra, tinkamas ir greitas svetainės įkėlimo laikas. Bet tik an SEO ekspertas gali padėti užtikrinti, kad tai būtų padaryta tinkamai ir kad svetainės puslapis būtų rodomas pirmajame „Google“ paieškos rezultatų puslapyje.


Kodėl „Googlebot“ neaptinka visų puslapių kai kuriose svetainėse?

Vieno iš „Google“ SEO biuro „Hangout“ metu buvo užduotas klausimas, kodėl „Googlebot“ nepakankamai tikrina kai kurių svetainių puslapius. Interneto serveryje yra viešai paskelbta daugiau nei šimtai milijardų puslapių. Žmonės kiekvieną dieną serveryje skelbia naują puslapį, o tai reiškia, kad „Googlebot“ gali indeksuoti daugiau puslapių. Tačiau kartais robotas neatitinka lūkesčių; tai yra; per mažiau nei sekundę sukaupti daugiau nei milijoną GB informacijos. Yra keletas priežasčių, kodėl taip gali atsitikti.

Pirma, gali būti, kad internete yra per daug turinio, puslapių ir svetainių, kurias galima indeksuoti. Kai kurie iš jų yra prastos kokybės, kiti turi lėtą svetainės įkėlimo greitį, o likusieji gali turėti nesvarbų turinį su sudėtinga svetainės struktūra (arba bet kuo kitu, kas prieštarauja gerai naudotojų patirčiai). Štai kodėl „Google“ sukūrė strategiją, skirtą indeksuoti tik aukštos kokybės tinklalapius ir išskirti prastesnės kokybės puslapius. Tokiu būdu puslapius galima filtruoti ir sumažinti (užuot indeksavus visus puslapius internete - tiek vertingus, tiek nevertingus).

Tačiau tai, kas išdėstyta aukščiau, neatsako į klausimą: Kodėl „Googlebot“ neaptinka visų svetainių? Labiau domina klausimas, kodėl „Googlebot“ neskaito visų svetainės puslapių (arba pakankamai puslapių). Ir į tai yra du atsakymai. Ilgas ir trumpas atsakymas:

Trumpas atsakymas

„Google“ per kiekvieną svetainę tikrina tam tikrą išteklių ir laiko kiekį. Tai vadinama svetainės tikrinimo biudžetu. Todėl robotas tikrina ir indeksuoja šį biudžetą. Taigi, jei svetainėje yra daugiau nei dešimt tūkstančių puslapių, ne visi puslapiai būtų indeksuojami.

Tačiau tai yra daugiau, o tai leidžia mums rasti ilgą atsakymą:

Ilgas atsakymas


Tikrinimo biudžetas lemia puslapių, kuriuos „Googlebot“ gali tikrinti ir indeksuoti, skaičių svetainėje kiekvieną dieną. Tačiau, kaip minėta anksčiau, tai yra daug daugiau. Kai kurie veiksniai lemia voro tempą, kai tikrinama per kiekvieną svetainę, neviršijant tikrinimo biudžeto. Logiška? Tai reiškia, kad nors biudžetas sukūrė ribą, kai kurie veiksniai gali pagreitinti arba sulėtinti robotą. Jie įtraukia:
  1. Lėtas serveris: Jei serverio atsako laikas yra labai lėtas, tai gali pakeisti greitį, kuriuo robotas tikrina kiekvieną puslapį tikrinimo biudžete. Svetainių savininkai gali juos patikrinti savo tikrinimo statistikos ataskaitoje. Patariama, kad viskas, kas viršija 300 milisekundžių, nėra geras atsako laikas.
  2. Svetainės serverio priegloba: Jei svetainė priglobiama bendrinamame serveryje, tai gali sulėtinti kiekvieno puslapio rodymo „Google“ rodymo spartą. Taip yra todėl, kad kitos to paties serverio svetainės gali jį sulėtinti naudodami didelius išteklius. Dar blogiau, kai tas pats serveris priglobia daugybę svetainių.
  3. „Rouge Bots“: Tai kiti robotai, kurie gali trukdyti, užblokuoti ar sulėtinti „Googlebot“ veiksmus. Jie gali būti įvairių formų ir kartais svetainei reikia profesionalios pagalbos, kad būtų galima valdyti ir kontroliuoti šių robotų veiksmus.
  4. Svetainės nuskaitymo galimybė: Tai yra tikrinimo programos prieigos prie visų svetainės puslapių kiekis. Kai programinė įranga gali lengvai pasiekti svetainės turinį, daugelis puslapių bus tikrinami ir indeksuojami pagal tikrinimo biudžetą.

Kaip optimizuoti savo svetainę, kad padidintumėte „Googlebot“ biudžetą


Ankstesniame skyriuje aptarėme veiksnius, lemiančius, kaip greitai (ar kaip lėtai) „Googlebot“ tikrina puslapį. Tačiau žmogus gali daugiau nei padaryti, kad maksimaliai padidintų puslapių, kuriuos robotas tikrina pagal biudžetą, skaičių. Trumpai tariant, čia yra keletas dalykų, kuriuos svetainės savininkas gali padaryti, kad maksimaliai padidintų puslapių, kuriuos „Googlebot“ tikrina ir indeksuoja per tikrinimo biudžetą per dieną, skaičių.
  1. Sukurkite svetainės žemėlapį: Tai yra vienas iš dalykų, kuriuos galima padaryti norint padėti „Googlebot“ greičiau naršyti svetainėje. Svetainės žemėlapį galima įdiegti, sukurti iš svetainės schemos generatoriaus arba sukurti nuo nulio.
  2. Investuokite į svetainės organizavimą: Tai susiję su svetainės struktūra ir svetainės puslapių suskirstymu į kategorijas. Kai svetainė yra sukonstruota taip, kad lankytojai galėtų lengvai suprasti ir naršyti savo kelią, yra didelė tikimybė, kad „Googlebot“ bus lengva naršyti.
  3. Svetainės optimizavimas: Tai apibendrina visus aukščiau paminėtus dalykus. Kai svetainė yra nuolat optimizuojama (tinkamu būdu), svetainės sąsaja bus tinkamai suplanuota ir sukurtas svetainės planas. Kiti dalykai apima tikrinimą blokuojančių veiksnių valdymą (pvz., Robots.txt), pavadinimo optimizavimą, turinio skaitomumą, turinio vertę ir daug daugiau. Tinkamai optimizavus svetainę, „Googlebot“ greičiau nuskaitys tokios svetainės puslapius.

Išvada

„Googlebot“ galima laikyti mažu interneto robotu, dirbančiu „Google“. Tai apima puslapių gavimą iš žiniatinklio serverio per nuorodas į svetaines. Tada jis peržiūri kiekvieną puslapį ir įtraukia jį į indeksuotos informacijos rinkinį. Tačiau dėl kelių veiksnių ir kintamųjų robotas negali nuskaityti visų kiekvienos svetainės puslapių (iš tikrųjų kartais to nepakanka). Ir iš visų paminėtų veiksnių ir sprendimų lengviausias sprendimas yra samdyti tokią profesionalią įmonę kaip Semaltas kuri gali padaryti viską, ko reikia, tinkamu būdu ir tinkamu laiku, kad užtikrintų, jog svarbūs jūsų svetainės puslapiai bus tikrinami ir indeksuojami, jei ne visi.

mass gmail