De laatste paar dagen zie ik in de statistieken van een van mijn website een bezoeker langskomen, die een pagina heel kort bekijkt en dan weer weg is.
Er staat ook geen referrer bij, en snel daarna gebeurt weer hetzelfde met een andere pagina… een soort hit en run dus..
Na een kort onderzoek blijkt het te gaan om een nieuwe zoekmachine robot genaamd Charlotte, en ze komt van Searchme Inc een Startup uit Mountain View,CA waar je ook de beroemde Googleplex kunt vinden.
Nu is het bezoek van een zoekmachine robot de normaalste zaak van de wereld zou je denken, maar deze is net even anders…
Ik gebruik namelijk de gratis statieken van Statcounter, simpel omdat ze snel zijn en ik ze ook verborgen mag gebruiken, geen 1 dot pixels of zo dus.
En statcounter maakt gebruik van Javascripts om die statitieken te verzamelen.
Maar zoekmachine robots lezen toch geen Javascripts? Of toch wel, deze Charlotte in iedergeval wel!
Een heel af en toe zie ik zelfs een Googlebot in de statieken voorkomen.
Zouden de zoekmachines dan weer een stap verder gaan en ook op javascripts gebaseerde menu's kunnen lezen?
Nu is Charlotte natuurlijk welkom om mijn sites, hoe meer geindexeerd hoe beter.
Maar je wil haar niet zien in je bezoekers statistieken, dus is de simpelste methode om haar volledig uit mijn overzichten te verwijderen is om een instelling in statcounter aan te passen.
Ga daarvoor naar je Settings en in het veld onderin waar staat IP Blocking vul je in 208.111.154.*
Daarmee laat je Charlotte nog wel toe op je site, maar komt ze niet meer in je statieken voor.
Wil je Charlotte helemaal blokkeren om je site te bezoeken, neem dan de volgende tekst op in je robots.txt bestand:
User-Agent: Charlotte
Disallow: /
Nu alleen nog zien uit te vinden waarom een Wikipedia zoekmachine zoals Wikiseek ook andere webpagina's buiten wikipedia aan het indexen is…
D. van der Valk zegt
Over wikipedia gesproken, een bezoekje aan hun robots.txt kan heel leerzaam zijn ;)
http://nl.wikipedia.org/robots.txt
Hummerbie zegt
@D van der Valk: Inderdaad een hele mooie robots.txt zeker gezien de hoeveelheid Disallow blockades.
Charlotte staat er nu in iedergeval (nog) niet bij, anders zouden ze echt een probleem krijgen.