Leoparddrengens
Public Key

mandag den 30. august 2010, kl. 14.47

Tip: Undgå at dine arkiv-oversigter indekseres af Google

Advarsel: Følg kun anvisningerne herunder efter også at have læst det opfølgende indlæg - og jeg vil anbefale at man bruger løsningen angivet der - medmindre man er helt klar over konsekvenserne af nedenstående, og alligevel ønsker det.

Dette indlæg er henvendt til de som har en Blogger-blog; og skal jeg være helt ærlig har jeg ikke rigtigt styr på effekten af det (endnu).

Men når jeg kigger i Google Analytics, kan jeg for en del søgninger se, at de havner på en side, som for eksempel kan hedde /2009_11_01_archive.html. Dette er en af mine arkiv-sider - for mig er de ordnet ugentligt, for de fleste vil de være inddelt i måneder - men de indeholder alle indlæg for perioden.

Det har virket meget tilfældigt, hvornår Google har valgt at bruge en oversigtsside, eller indlægget selv; sandsynligvis har det noget at gøre med en tilfældig i rækkefølgen i hvornår indekseringsrobotten er nået til den enkelte side.

Og det irriterer mig - for jeg vil helst have, at de som søger skal finde dét indlæg, der handler om det de søger efter - så de ikke skal rode rundt i alle de ikke-relevante indlæg, som de også får frem. Og sandsynligheden er, at den søgende hopper videre til næste søgeresultat, hvis de ikke umiddelbart kan se noget relevant på min side. Desuden ved jeg, at Google ikke bryder sig om, at det samme indhold står flere steder - og det gør det jo på sin vis på disse samle-sider - uden at jeg selv er skyld i det.

Så derfor ville jeg gerne have Google (og øvrige søgemaskiner for den sags skyld) til ignorere mine oversigtssider - inklusive min blog-forside! - og kun indeksere de enkelte indlægssider.

Og jeg fandt en løsning, som jeg nu har haft aktiv i ca fjorten dage. Jeg tror nok den virker - men jeg får stadig søgninger ind på nogle af de gamle arkiver (men ikke af nyere dato). Det skyldes sandsynligvis, at Googles robot er mange måneder om at komme rundt i alle krogene, og derfor endnu ikke har læst, at de sider ikke skal indekseres.

Anyway, den løsning jeg fandt på, er at lægge følgende kodestump ind i headeren i sin template:

<b:if cond='data:blog.pageType == "item"'>
   <meta content='index,follow' name='robots'/>
<b:else/>
   <meta content='noindex,follow' name='robots'/>
</b:if>


(Se eventuelt indlægget om en bedre title i Blogger for at se hvor det skal lægges ind - for det skal ind ved siden af det jeg beskriver der - i <head>-sektionen. Man kan faktisk også slå de to kodestumper sammen, det kan man jo gøre hvis man har styr på den slags.)

Det der sker i den ovenstående stump kode, er at så frermt det er et indlæg, gives der besked til indekseringsrobotterne, at denne side skal de indeksere; men hvis det ikke er et indlæg skal de holde sig væk fra at komme indholdet i deres indeks, men følge links til udersider. (Den første linie er faktisk ligegyldig, da det er default behaviour - men jeg kan bedst lide at have den med for overblikkets skyld.)

Ceterum censeo Facebook esse delendam.

3 kommentarer:

Uden Relevans sagde ...

For os der ikke er ørne i HTML, kan du så definere nærmere hvor koden skal sættes ind?

På forhånd tak.

Leoparddrengen sagde ...

Well, jeg henviser da til det andet indlæg, hvor jeg viser med billeder hvor det skal ind - og det her skal samme sted.

Men altså, hvis man finder to linier hvor der står:
<head>
<b:include data='blog' name='all-head-content'/>

Så kan man komme det ind under det.

Uden Relevans sagde ...

Tak Leo