Leoparddrengens
Public Key

torsdag den 26. august 2010, kl. 13.44

PageRank - en forklaring

En af de måder Google benytter til at prøve at finde ud af, hvilke sider som er mest betydende - og dermed skal stå længere oppe i et søgeresultat - er PageRank.

Larry Page
Det skal understreges, at det kun er én af måderne, og Google har selv prøvet at nedtone betydningen af den. Men da det samtidig er en målbar størrelse, og det er noget man kan gøre noget ved, er det en, som ihvertfald nogle SEO folk hæfter sig meget ved.

PageRank hedder ikke sådan, fordi man rangerer sider med den - det er ikke den officielle forklaring ihvertfald. Den er derimod opkaldt efter sin opfinder, Larry Page - som så tilfældigvis også er en af grundlæggerne af Google. Algoritmen er patenteret - et patent som Stanford University ejer, men som de har fået en hulens masse aktier i Google, for at give google eksklusiv retten til at bruge.

Idéen i PageRank er, at den kan bruges til at beregne hvor stor en sandsynlighed der er, for at en tilfældigt klikkende bruger havner på en bestemt side på nettet. Alle sider har en (meget lille) basis sandsynlighed, men hvis der tilgår links til siden øges denne sandsynlighed - alt efter hvor mange links der er, og hvor de kommer fra.

For hvis et link kommer fra en side, hvor der er står sandsynlighed for at man kommer, vil denne sandsynlighed smitte af på modtageren af linket.

På samme måde giver man også sin sandsynlighed videre - de links der findes på en side, giver ligeligt deres sandsynlighed til de sider der linkes til.

Hvis man ikke linker ud fra en side overhovedet, er det defineret som, at man linker til alle sider på nettet (for den tilfældigt klikkende bruger stopper ikke, men han er nødt til at gå op og skrive en tilfældig url i adresselinien).

Og en detalje i algoritmen gør, at der er en fordampende effekt; et links "styrke" fortaber sig, efterhånden som det kommer igennem flere led.

I det hele taget synes jeg man får det bedste billede, ved at se hver side som en flod (eller bæk). Der løber vand til fra forskellige sider, af strømme af forskellig styrke. Og længere nede splittes floden så op igen - nu i strømme af ensartet styrke, som fordeler sig ud til andre floder.

Så - for at få en høj PageRank, gælder det om at få så mange til at linke til sig, som muligt, og meget gerne fra steder som selv har en høj PageRank.

Wikipedia har i deres omtale en meget illustrativt tegning af et mini-net, med forskellige sider, som modtager og afgiver forskellige antal links - sidernes resulterende PageRank er illustreret ved størrelsen af cirklen som symboliserer den enkelte side.

At lave en sådan PageRank beregning er ikke en lille ting, da den kræver flere gennemløb af hele nettet - og det kan aldrig blive et præcist resultat, da beregninger afhænger af andre beregninger, som ikke er foretaget endnu. Som jeg forstår det, bliver de enklete sider opdateret 3-4 gange om året, men mit gæt er, at det sker som del af en løbende proces.

Som sagt har det at have en høj PageRank - især for nogen SEO folk - stået som en meget, meget vigtig ting. Hvorfor de har gjort meget for at få mængder af links til at pege på sider. Men det forpurrede Google til dels, da de indførte nofollow linket (som jeg tidligere har forklaret) - for nofollow links tæller heller ikke i PageRank-regnskabet (så den tilfældige klikker er holdt op med at klikke helt tilfældigt). Istedet er der så opstået sider, som har opnået høj PageRank, hvor man kan købe sig ind, og få et link.

En farlig praksis, da Google ikke bryder sig om købte links, og hvis de opdager det, kan de gå ind og sætte de involveredes siders PageRank til 0.

Man kan få oplyst PageRank for en url på forskellig måde: hvis man har Google Toolbar kørende i Internet Explorer kan man sætte den op til at vise det, for den side man er inde på. I Firefox og Chrome (og sikkert andre) kan man installere en plugin som viser det. Ellers er der forskellige sider på nettet, som viser PageRank for en url - for eksempel www.checkpagerank.net. (Jeg har så aldrig fundet ud af, hvor de slår det op henne, hvilket irriterer mig.)

Det tal man får oplyst der, er ikke en procentchance for et tilfældigt besøg - det tal ville nok også være meget, meget lille - men et tal mellem 0 og 10. Jeg er ikke ganske sikker på hvordan man kommer fra det ene tal til det andet, men det er en form for logaritmisk skala, så det kræver en del mere at gå fra 7 til 8, end fra 1 til 2, for eksempel.

Anyway: man skal ikke lægge for meget vægt på PageRank, som Google da også selv understreger. Men som en af de ting, som får nettet til at fungere som det gør, kan det jo være meget godt at kende lidt til. Så det håber jeg, at jeg har kunne bidrage til.

Ceterum censeo Facebook esse delendam.

0 kommentarer: