Gebruikerslogin

Nu online

Er zijn momenteel 1 gebruiker en 1 gast online.

Enquête

Wat is leuker?
White hat SEO
70%
Black hat SEO
30%
Totaal aantal stemmen: 98

Over het aantal geïndexeerde pagina's

Een terrein waar ik niet veel over lees, is het aantal geïndexeerde pagina's van een site. Toch is dit in mijn ogen op SEO-gebied een belangrijke factor in je SEO-campagne. Ik wil drie redenen noemen waarom het aantal geïndexeerde pagina's relevant is voor je zoekmachine-positionering.

  • Allereerst staan op elke pagina die extra geïndexeerd wordt waarschijnlijk unieke keywords die leuk kunnen zijn voor je long tail. Zeker als je site qua content redelijk divers is, is dit een belangrijk punt.
  • Ulco meldde in een eerder artikel al dat je d.m.v. veel content, bepaalde keywords flink kan laten scoren. Ik merk dit zelf op www.sudokutips.nl. De URL's van de puzzels zijn /sudoku-spelen/puzzel-$id en hoe meer puzzels er geïndexeerd raken, hoe hoger ik sta op 'sudoku spelen'.
  • Ten derde biedt een grotere site je meer mogelijkheden om van verschillende pagina's te linken naar je hoofdpagina's. Gezien het PageRank-algoritme betekent dit dat je hoofdpagina's beter scoren. Dit is waarschijnlijk ook de reden dat blogs op Netters vaak beter scoren dan artikelen. Op elke pagina staat een lijstje met de laatste blog-items terwijl artikelen vaak in één blog worden aangekondigd en verder maar op een enkele pagina een link bevatten.

Hoe moet ik pagina's laten indexeren?

Hieronder noem ik een groot aantal mogelijke manieren om je aantal geïndexeerde pagina's te vergroten. Ik zeg er meteen bij dat ik met lang niet alle methoden testervaring heb, maar ik beargumenteer wel mijn vermoedens. Het staat je dus zeker vrij om dingen aan te vechten of juist verder uit te diepen.

Opmerking:
Ik ga er van uit dat je bezig bent met een normale site en niet één of andere site die enkel door scrapers en RSS-feeds gevuld wordt. In dat geval gaan veel van onderstaande voorstellen ook op, maar wellicht wil je dan nog wat agressievere tactieken uitvoeren. Dat is ook zeker leuk, maar voor vandaag gaan we simpelweg uit van de bestaande content en maken we geen gebruik van de str_replace() functie ;-)

Backlinks/deeplinks

Hoe meer backlinks je krijgt, hoe dieper Google je site indexeert. Met 'dieper' bedoel ik dat Google verder op zoek zal gaan naar dieperliggende pagina's, de zgn. deeplinks. Daarnaast is het zeer de moeite waard om backlinks te krijgen naar dieperliggende pagina's in je site zodat Google daar kan beginnen met crawlen en indexeren. Ik had betreffende het punt van het aantal backlinks ook kunnen zeggen dat je een zo hoog mogelijke PageRank nodig hebt, omdat de PageRank in feite een gewogen gemiddelde van je aantal en de kwaliteit van de backlinks is.

Unieke content

Google bekijkt per pagina of deze interessant is. Hierbij wordt niet alleen naar de tekst gekeken, maar ook naar de URL en de titel. Een aantal mogelijke redenen waarom Google wellicht een pagina niet zal indexeren zijn bijvoorbeeld:

  • "Dit is al de twintigste pagina met 'Bedrijfsnaam B.V.' als paginatitel".
  • "Hé, de content van deze pagina kwam ik 'hier' ook al tegen."
  • "Huh? Dit is al de veertigste URL die begint met 'index.php?id=3&sessionID='."

Je dient dus de pagina's interessant te maken voor Google. Dit doe je niet alleen door er een aantal backlinks heen te sturen, maar ook door de content, de URL en de titel van de pagina uniek te laten zijn.

Goede sitestructuur

Wat we bij Netters doen, is in veel blogpostings linken naar andere blogs en artikelen en soms naar user-profielen. Op die manier gaat de spider flink random door je site heen en dat betekent dat de spider steeds andere pagina's tegen komt bij het spideren. In de praktijk blijven er veel van die gevonden pagina's in de index hangen.

Je sitestructuur zal in de regel een piramidevorm moeten hebben. De bezoeker komt binnen op de homepage en komt dan terecht op de hoofdsecties van je site (bijvoorbeeld artikelen, blog, forum). Vanuit de hoofdsecties komt je bezoeker terecht op de categorieën (bijvoorbeeld HTML, PHP, SEO). Vanaf dat niveau komt de bezoeker uiteindelijk terecht op de items (zoals individuele forumberichten).

Een zeer goed voorbeeld van een slechte sitestructuur is www.itjobboard.nl. Deze site plaatst vele vacatures per week, maar ze zijn slechts via een zoekmachine bereikbaar. Probeer maar eens - zonder het formulier te submitten - bij de vacatures uit te komen en je zult snappen dat Google even veel moeite heeft als jij om deze relevante content te vinden.

Sitemap

Een sitemap (ik doel hierbij niet op een XML Sitemap) kan de indexatie van je website versnellen, omdat je daar links kan plaatsen naar alle relevante (hoofd)items van je site. Als een sitemap op elke pagina gelinkt wordt door de link bijvoorbeeld vast in de footer te zetten, is elke hoofdsectie van je site binnen twee kliks vanaf elke pagina te bereiken.

Subdomeinen

Zoekmachines schijnen in de praktijk een voorliefde voor subdomeinen te hebben. Elk subdomein wordt namelijk gezien als een aparte site. In de praktijk is het makkelijk om op 10 subdomeinen 1.000 pagina's per subdomein geïndexeerd te krijgen, dan 10.000 pagina's op 1 domein. Voorwaarde is dan wel dat je redelijk wat heen en weer linkt, want de subdomeinen hebben dan wel eigen backlinks nodig.

Google producten (Search, Sitemap)

Wat een typisch fabeltje zou kunnen zijn, is dat het gebruik van Google diensten op je eigen site (zoals Google Search of Google Sitemaps) de indexatie van je site bevordert. Uiteraard is de Google Sitemap bedoelt om de spider aan te wijzen waar de pagina's zich bevinden, maar ik vermoed dat een goede sitestructuur het gebruik van Sitemaps in principe overbodig maakt. Sterker nog, David Naylor geeft goede argumenten om maar helemaal geen Google Sitemap te gebruiken.

Dat het gebruik van Google Search het aantal geïndexeerde pagina's zal vergroten is iets wat ik niet geloof. De enige reden dat het punt hier staat is om het keihard te ontkrachten ;-)

Opmerking:
Dit artikel is in eerder stadium gelezen en van commentaar voorzien door Joost, waarvoor hartelijke dank!

Joost de Valk
Avatar van Joost de Valk
Aantal berichten: 87

Graag gedaan ;)

Sandra
Avatar van Sandra
Aantal berichten: 245

Jammer dat je sudoku-site al af is ;-).

RobbieRedskin
Avatar van RobbieRedskin
Aantal berichten: 133

Naar mijn mening laat je één belangrijk punt in je (overigens goede) artikel liggen. Er zijn situaties waarin het beter is om het aantal geindexeerde pagina's te verminderen.

Dit is uiteraard zo als het om duplicate content gaat. Maar het gaat ook op voor sites met veel pagina's. De methode die jij beschrijft om de spider kriskras door de site te laten crossen heeft namelijk als neveneffect dat je PageRank verwatert. Of in ieder geval wordt verspreid over de verkeerde pagina's.

In het eerste geval wordt 'de spoeling dunner' waardoor je site als geheel lastiger kan ranken. In het tweede geval scoor je niet optimaal op je meest belangrijke keywords.

Een en ander is op te lossen door selectief te linken. Door de pagina's met de meeste 'power to give' (pagina's met hoge PR) te laten linken naar die pagina's waarvan je ook wilt dat ze hoog ranken. En pagina's waar je minder belang aan hecht 'opofferen' door ze minder interne links te geven. In een woord: het gaat om je interne linkstructuur. (Je geeft daar overigens zelf een voorbeeld van door op te merken dat de blogs vaak hoger scoren dan de artikelen - ik kan me voorstellen dat jullie dat liever anders zouden zien).

Voor een site met twintig pagina's maakt het bovenstaande niet veel uit, maar voor grote sites kan het verschil significant zijn op bepaalde keywords.