Kennisbank » Overig » Hoe werkt een zoekmachine?

Hoe werkt een zoekmachine?

31 maart 2007

Websites worden gebouwd om effect te hebben.
Om ervoor te zorgen dat je website goed scoort in zoekmachines (Google) dien je eerst de logica en techniek erachter te begrijpen. Dit is de eerste stap op weg naar zoekmachine optimalisatie. Je moet je afvragen hoe een zoekmachine eigenlijk werkt en hoe hij bepaalt wat wel belangrijk is en wat niet? Helaas krijgen we op het laatste geen antwoord aangezien de formule van Google ongeveer het grootste geheim ter wereld is geworden. Ondanks dat Google dit niet prijsgeeft, lichten ze hier en daar wel en tipje van de sluier op.

Een zoekmachine bestaat uit een of meerdere ‘spiders’. De spider is een applicatie dat het beste te vergelijken is met een standaard browser als Internet Explorer. Hij leest de pagina’s op je website en gaat de koppelingen af die erop gelinkt staan. De zoekmachine spider hecht waarde aan alle tekst en technische elementen op websites. Alle tekst op je website slaat de spider op in zijn cachegeheugen, en hij gaat weer verder met de volgende website. Dit proces herhaalt zich iedere keer, zo zwerft de spider het hele internet over. Even wat cijfers tussendoor. De juiste aantallen zijn niet te schatten, maar mei 2010 indexeren Google, Bing, Ask en Yahoo!:
1. 20 miljard pagina’s wereldwijd
2. 150 miljoen domeinnamen wereldwijd
3. 350 miljoen pagina’s in Nederland
4. 4 miljoen domeinnamen in Nederland

Dat dit een schatting is, komt o.a. door het feit men zoekmachines met robot.txt files niet toestaat te laten indexeren.

Ook de spider zegt ‘I’ll be back’
Eens in de zoveel tijd komt de spider weer terug op je website om te kijken of er nog iets veranderd is sinds zijn laatste bezoek. De regelmaat waarmee de spider terugkomt, is niet te beïnvloeden. Vroeger kon er nog wel eens gebruik gemaakt worden van de Metatag ‘revisit-after’, maar dit is achterhaald. Tegenwoordig bepaalt de spider zelf met welke regelmaat hij terugkomt aan de hand van een ingewikkelde formule.
In principe kan je website wel worden gevonden door een spider, zonder dat je hem ook maar ergens hebt aangemeld. Dit gebeurt zodra iemand een link opneemt naar een van jouw webpagina’s. Dan is het een kwestie van tijd voordat de zoekmachine je nieuwe website gevonden heeft en deze opneemt. Dit kan echter wel enkele maanden duren; afhankelijk van hoe belangrijk Google de website vindt waarop naar jouw website gelinkt wordt. Linkbuilding is de moeite waard!

Een goede opzet is het halve werk
Jaren gelden konden zoekmachines alleen overweg met tekst in de content. Spiders lazen geen plaatjes, Flash-websites en bestanden zoals PDF-files. Tegenwoordig worden PDF- en Flash-bestanden ook meegenomen door de spiders. Dit is erg handig als bijvoorbeeld belangrijke persberichten of nieuwsberichten op de website staan in de PDF formaat. Hoe meer tekst en pagina’s je website bevat, hoe beter deze te indexeren is door de zoekmachine. Om een maximaal rendement uit de zoekmachines te halen is het dus het beste dat je voordat je een site maakt goed nadenkt over de opzet van je pagina’s. Stel je hebt je website jaren geleden laten maken door een bedrijf dat geen verstand had van zoekmachine optimalisatie, maar wel de website heeft ontworpen, dan kan je achteraf al die tientallen tot soms wel duizenden pagina’s een voor een weer gaan optimaliseren. In dat geval ben je vaak meer tijd, geld en moeite kwijt aan het opschonen van de pagina’s als dat ze oorspronkelijk ooit gekost hebben.

Houd je kennis op peil

Ontvang onze artikelen.