Tout bon webmaster qui se respecte utilise des outils pour tester son site, vérifier que les pages sont conformes aux standards, qu'elles ne comportent pas d'erreurs, qu'elles soient accessibles, ...
Google propose justement des outils bien pratiques pour réaliser ces tâches : Google webmaster tools.
Je l'utilise pour tous mes sites et je dois bien avouer qu'il est d'un grand secours cependant il pêche par un défaut ses anachronismes. Il ne s'agit pas d'un bug mais de son mode de fonctionnement. Il s'appuie sur le crawler de google pour apporter un ensemble de données sur votre site. Ces données sont récoltées à intervalles irréguliers. Le crawler permet de parcourir votre site, récupérer les descriptions, titres et toutes les informations sur vos pages. Un gros problème se pose! Vous ne savez pas quand il passe et vous ne pouvez pas le forcer à analyser votre site.
Google webmaster tools renvoie ces informations. Si des informations indiquent des erreurs sur vos pages, vous les corrigez. Bon réflexe! Avant que google se rende compte que vous avez corrigé ce qui allait pas, il faut patienter et certaines erreurs restent des jours, des semaines et parfois des mois...C'est bof bof mais, au moins, vous êtes quasiment sûrs d'avoir corrigé ce qui allait pas à une certaine date.
Bon, quand google a un peu de retard sur ses analyses, on se dit "OK, c'est pas grave, au prochain tour les erreurs auront disparues" mais on peut se retrouver confronter à de véritables anachronismes de google webmaster tools.
Nous allons analyser un exemple : les URLs introuvables. Voici une liste de quelques pages introuvables. Effectivement, le site vit et certaines pages n'existent plus. Prenons le cinquième lien, la page manquante a été repérée le 20 novembre 2011 (c'est récent).
Maintenant, voyons voir quelles autres pages référencent cette page. Il se peut qu'un lien ait été oublié.
Euh...parmi les 3 liens trouvés, les 2 premiers n'existent plus et la 3e est la page d'accueil. Et, plus surprenant, google a trouvé ces pages en 2010 soit plus d'un an!!! Donc comment google peut trouver un lien inexistant en 2011 sur des pages qu'il avait trouvé en 2010??? D'autant plus que la page d'accueil a bien été mise à jour et le nouveau contenu de la page d'accueil a bien été pris en compte par google donc il y a un gros problème d'anachronisme (CQFD).
Malheureusement, on doit travailler avec ce mode de fonctionnement en espérant qu'un jour google nous fournisse ces outils en temps réel.