Aaaah le cache de Google !
Publi� le 10 novembre 2005

J'ai remarqué dans mes statistiques la venue régulière d'un visiteur provenant de boteyes.com identifié comme un robot d'indexation. En allant sur le site, une page indique que le site devrait ouvrir prochainement. Qu'est-ce donc que ce boteyes.com ? A vrai dire j'ai déjà la réponse et ce n'est pas çà qui est intéressant. Boteyes est un service qui permet de se faire passer pour un moteur de recherche afin d'optimiser un site.

Ce qu'il y a d'intéressant c'est ce qu'on découvre dans Google. A priori rien de spécial seule la page d'accueil est indexée, ce qui est normal. Mais en essayant de de cliquer sur le lien cache, on obtient plusieurs fichiers PHP dont un code source visible qui est le code du programme principal de leur service d'aggrégation de flux RSS/XML. C'est ballot ! pourrait-on dire.

Raison de plus de bien remplir le robot.txt à la racine du site et de le doubler par sécurité avec un <meta name="robots" content="noindex"> sur toutes les pages.