WordPress : Bien indexer son site et éviter le duplicate content

Indexer son site Wordpress

L’indexation d’un site est une étape essentielle dans l’optimisation de son référencement et, les sites WordPress ne dérogent pas à la règle. Il s’agit en effet de sélectionner les pages que vous souhaitez rendre visibles sur les moteurs de recherche. Cette étape est importante, car Google et ses confrères détestent le contenu dupliqué, qu’il soit interne ou externe. Vous ne devez pas, par exemple, indexer deux pages quasiment identiques, avec un contenu similaire mais avec une URL différente. Les moteurs de recherche vont également juger votre site dans sa globalité : vos pages qui ne sont pas optimisées et qui comportent peu de contenu peuvent faire baisser le niveau de qualité global de votre site internet. Nous allons donc voir, dans cet article, comment bien indexer votre site WordPress grâce à l’installation de plugins et à l’aide de tutoriels détaillés.

Éviter le contenu dupliqué grâce à la balise Meta Robots

Pour un blog ou un site WordPress, je recommande tout d’abord l’extension WordPress appelée « Yoast WordPress SEO » qui est l’un des meilleurs plugins pour le référencement.

Une fois que l’extension est téléchargée et activée sur le WordPress (Onglet « Extensions »), voici quelques paramètres personnalisés bien utiles :

Dans l’onglet « Titres et Métas » – Partie « Autres »

Je vous recommande de cocher « Ne pas indexer les sous-pages des archives ». En effet, cette case permettra de limiter le nombre de pages indexées causées par la pagination du blog.

Limiter l'indexation des pages archives WordPress.

Dans l’onglet « Titres et Métas » – Partie « Taxonomies »

La case « no index, follow » permet de limiter également la multiplication excessive des pages indexées liées à la catégorisation du blog et à l’utilisation des mots-clés (ou tags). A cocher pour « Catégories » et « Mots-clés ».

Gérer l'indexation des différents modèles de pages sous WordPress.

Attention, ce point est à reconsidérer selon les cas. En effet, une stratégie SEO peut se baser sur l’utilisation de ces modèles de pages. En effet, si dans votre stratégie vous décidez d’indexer ces pages, je vous recommande vivement de les personnaliser comme vous le feriez avec toute autre page. Pour cela, je vous recommande le module Visual Term Description Editor.

Modifier les pages tags sur WordPress.

Dans l’onglet « Titres et Métas » – Partie « Autres »

Même paramètre pour les pages générées à partir des archives de l’auteur et des archives datées.

Mention « no index, follow » à appliquer pour « Archives de l’auteur » et « Archives par date ».

Optimiser le SEO d'un wordpress.


Le sitemap XML pour faciliter le travail des robots

Le plugin SEO de Yoast propose également une fonctionnalité permettant de générer un sitemap XML conforme aux attentes des navigateurs. Ce sitemap vous permet d’indexer l’ensemble des pages les plus pertinentes de votre site. Il représente l’architecture du site avec les pages que vous souhaitez référencer et va faciliter le travail des robots des moteurs de recherche en indiquant précisément quelles sont les pages présentes sur votre site.

Une fois généré, il est intéressant de déclarer ce sitemap sur les outils mis à disposition par les moteurs de recherche : la Search Console de Google ou Bing Webmaster Tool par exemple. De cette manière, vous êtes sûr qu’aucune de vos pages ne passera à travers les mailles du filet lorsqu’un robot passera sur votre site WordPress.

 

Sitemap wordpress

Le Robots.txt pour donner des consignes aux « bots »

Avec l’outil Yoast présenté plus haut, vous avez la possibilité d’éditer facilement votre fichier robots.txt dans l’onglet « Outils » puis « Editeur de fichiers« . Ce fichier peut paraître désuet avec ses quelques lignes dans un petit fichier texte, néanmoins il revêt une importance capitale : mal configuré, il peut faire en sorte que votre site soit complètement désindexé des moteurs de recherche ! Attention donc, à ne pas faire d’erreurs lorsque vous le manipulez.

Utiliser le Robots.txt

 

Pourquoi peut-il désindexer votre site WordPress ? Tout simplement car il permet de communiquer avec les robots des moteurs de recherche en leur donnant des permissions quant au crawling de votre site. Vous pouvez ainsi leur interdire d’accéder à certaines de vos pages ou dossiers grâce à une simple consigne « disallow ». En matière de référencement naturel, nous vous conseillons par exemple d’exclure les pages de votre site sans valeur ajoutée et non optimisées pour le SEO, car les moteurs de recherche comme Google jugent les sites dans leur intégralité. Page contact, mentions légales et autres pages avec un contenu pauvre et inutile qui ne génèrent pas de trafic organique peuvent donc être ajoutées à ce fichier avec une consigne « Disallow ».

A noter que sur certains sites WordPress, cette option d’édition ne sera pas disponible avec Yoast à cause de problèmes de droit. Il vous faudra donc passer directement par votre FTP en modifiant ce fichier à l’aide d’un éditeur de texte.

Vous avez désormais toutes les bases pour indexer correctement votre site ! Bien sur, il y a toujours de quoi optimiser encore un peu plus cet aspect là car chaque site est unique et il s’agit ici d’un tutoriel général. Si vous souhaitez allez plus loin dans l’optimisation SEO de votre site WordPress, n’hésitez pas à aller consulter nos autres articles sur ce thème ou à nous contacter.

Si ce tutoriel vous a été utile, n’hésitez pas à le partager !

Facebook
Twitter
LinkedIn