Un système de taxonomie est un outil d'architecture de l'information permettant d'organiser un ensemble donné de contenu. La taxonomie la plus célèbre est la taxonomie linnéenne pour classer les organismes. Dans les sites Web, cela prend généralement la forme de catégories et de balises qui regroupent les pages en fonction de sujets, d'entités ou d'autres concepts. Ce système d'organisation des informations aide les utilisateurs à naviguer et à localiser le contenu. Les catégories sont souvent générales et hiérarchiques. Les balises, en revanche, sont spécifiques et il n'y a pas de relation hiérarchique. Un élément de contenu peut être affecté à une catégorie mais peut avoir plusieurs balises.
Les meilleures taxonomies décrivent le contenu ou les produits qu'elles organisent avec précision, sont extensibles et peuvent accueillir de nouveaux sujets ou produits, et correspondent au modèle mental de l'utilisateur . Lorsqu'un site Web se développe, il peut mettre à rude épreuve le système de taxonomie en place. Il peut y avoir trop de catégories ou de balises pour être utiles aux lecteurs et il peut y avoir chevauchement et concurrence entre les taxonomies.
Un système de taxonomie bien géré peut aider vos utilisateurs à naviguer sur votre site Web et également soutenir votre stratégie de référencement.
Table des matières
Pourquoi une bonne taxonomie est stratégique pour le SEO
Comment la taxonomie impacte le SEO
Un bon système de taxonomie aide Google à comprendre la structure de votre site et quels sont les sujets que vous couvrez avec votre contenu. Il peut également aider à la découverte et à l'indexation du contenu.
Mais si ce n'est pas bien géré, les taxonomies peuvent potentiellement générer du contenu dupliqué et les pages d'archives peuvent entrer en concurrence dans le classement pour les mêmes mots-clés que les pages individuelles. Avec une bonne structure de liens internes et de taxonomie, vous pouvez indiquer à Google quelles pages sont les plus importantes, et quel contenu les moteurs de recherche doivent indexer et ce qu'ils ne doivent pas.
Sur une note plus technique, une taxonomie mal conçue peut également épuiser votre budget de crawl et impacter le flux de PageRank via votre maillage interne.
Un système de taxonomie peut également vous aider à gérer les modifications de votre site. Vos produits peuvent être en rupture de stock ou être remplacés par de nouveaux chaque saison. De nouveaux contenus remplacent constamment les nouvelles et les analyses qui sont désormais obsolètes. Mais votre taxonomie, la structure qui agit comme un échafaudage supportant votre site, reste pertinente. Les chaussures sont toujours des chaussures chaque saison, et il y a une nouvelle éliminatoire de la NBA chaque année. Les pages de contenu individuelles peuvent ne plus être pertinentes dans la recherche, mais la structure qui les supporte l'est.
Créer une taxonomie efficace pour le référencement
Selon l'objectif d'un site Web, une taxonomie peut être créée de deux points de vue différents :
- Basé sur le sujet du contenu. Vous pouvez définir le sujet principal que le site Web couvrira, ainsi que les sujets et sous-sujets que vous devrez avoir dans votre structure principale. Par exemple, pour un site Web d'informations sur la santé, vous pouvez organiser votre contenu en fonction des différentes parties du corps humain. Vous vous retrouverez donc avec une catégorie pour les maladies rénales et une autre pour les maladies cardiaques. 2. Basé sur l'utilisateur. Dans ce cas, le contenu correspondra au parcours d'utilisateur des différents utilisateurs qui visitent votre site. En utilisant le même exemple, un système d'organisation alternatif pour un site d'information sur la santé pourrait être par symptômes. Ou par âge, par exemple en regroupant des informations sur la santé des enfants ou des personnes âgées.
Dans chaque cas, vous devez d'abord identifier l'objectif de la taxonomie (par exemple : "aider les utilisateurs à trouver un bon restaurant à proximité de leur emplacement").
Types de taxonomie
La plupart des sites Web utilisent le système de double taxonomie des catégories et des balises, qui est un mélange de taxonomies hiérarchiques et plates. Mais ce ne sont pas les seuls types disponibles.
- Taxonomie hiérarchique : le concept décrit par la taxonomie est réduit au fur et à mesure que vous avancez dans la hiérarchie. Par exemple : Mammifères > vertébrés. La plupart des taxonomies hiérarchiques sont simples, avec une catégorie parent et une ou plusieurs catégories enfant. Dans ce cas, les catégories s'excluent mutuellement. Une polyhiérarchie se produit lorsqu'une catégorie enfant a plus d'une catégorie parent. Ils se produisent souvent dans les sites de commerce électronique. Par exemple, une console de jeu vidéo peut être placée sous des jeux vidéo ou sous de l'électronique.
- Taxonomie plate : il n'y a que des catégories de niveau supérieur et toutes ont le même poids. Un système de marquage tombe dans ce type de taxonomie.
- Taxonomie du réseau : chaque catégorie peut être liée à n'importe quelle autre catégorie et les relations entre elles peuvent être hiérarchiques ou sémantiques. Il peut être utilisé pour créer une navigation contextuelle, comme les articles les plus consultés, les lectures recommandées ou une liste de produits de vente incitative sur les sites de commerce électronique.
- Taxonomie des facettes : chaque élément possède un ensemble de catégories associées qui fonctionnent comme un ensemble d'attributs. Par exemple, sur un site de critiques de restaurants, vous verrez des attributs tels que la fourchette de prix, le type de nourriture, la note des utilisateurs, etc. Les sites de commerce électronique fonctionnent de la même manière. Un t-shirt aura des attributs comme la couleur, les tailles disponibles ou la coupe.
Architecture de l'information pour le référencement
Profondeur du site et des clics
L'autorité de la page diminue à chaque clic loin de la page d'accueil. Une page accessible depuis la page d'accueil en 2-3 clics sera jugée par les moteurs de recherche comme plus importante qu'une page accessible uniquement en cliquant sur 4-6 pages.
Lors de la planification de votre taxonomie, il est important de tenir compte de ce fait et de ne pas exagérer avec des catégories enfants ou d'autres éléments qui éloigneront votre contenu de votre page d'accueil.
Autorité thématique
Un système de taxonomie bien conçu aide les utilisateurs et les robots à naviguer et à comprendre la structure et le contenu de votre site Web. Les robots d'exploration des moteurs de recherche utilisent l'analyse sémantique pour comprendre les concepts et les cartographier ensemble. Le contenu connecté sous le même sujet crée une densité sémantique. Une concentration élevée de contenu connexe à l'intérieur d'un domaine est un signal pour les moteurs de recherche sur la pertinence du site pour ce sujet .
Si un système de taxonomie n'est pas mis en œuvre correctement, les catégories concurrentes et mixtes distribueront et dissoudront toute autorité thématique que vous pourriez avoir à partir du regroupement de contenu connecté. Il est important que vos catégories et balises soient bien définies et distinctes les unes des autres.
Structure d'URL et fil d'Ariane
Pour renforcer à Google la structure de votre site et signaler l'autorité de la page de catégorie, vous pouvez utiliser deux outils.
La première consiste à refléter la structure du site dans la structure de l'URL. Cela indiquera clairement à l'utilisateur et au robot de quoi parle la page. La longueur de l'URL n'est pas un facteur d'optimisation de la recherche. Tant que la catégorie reflète le sujet et est pertinente, le nom de la catégorie doit être inclus dans l'URL.
Les fils d'Ariane ont deux applications utiles. Tout d'abord, ils renverront de chaque élément de contenu individuel à la catégorie ou à la sous-catégorie où se trouve le contenu. Cela renforce l'autorité de la page d'archive de catégorie. Mais ils peuvent également apparaître à la place des URL dans le SERP. Cela fournit un indice visuel à l'utilisateur sur le sujet sur lequel porte le contenu.
Optimisation du contenu des pages de catégories
Pages d'archives de catégories en tant que pages de destination de recherche
Les pages de catégorie fonctionnent comme une archive pour tout le contenu qui se trouve dans cette catégorie. Selon le type de site Web et les sujets que vous couvrez, ces archives peuvent être plus importantes pour votre référencement que les pages de contenu individuelles.
En règle générale, plus le contenu expire rapidement, plus les archives de catégorie sont importantes pour le référencement. Par exemple, la page de catégorie d'une équipe sportive peut être plus pertinente à optimiser pour le référencement que les pages de chaque match de la saison. En revanche, un site Web d'informations sur la santé devrait se concentrer sur l'optimisation des pages pour des troubles spécifiques, comme la maladie de Crohn, plutôt que sur la catégorie de la santé gastro-intestinale.
Dans le premier exemple, la page de catégorie d'équipe sportive doit fonctionner comme une page de destination. Un point d'entrée pour les utilisateurs qui les redirige ensuite vers le contenu qu'ils recherchent. La stratégie sous-jacente est que la page de catégorie sera optimisée et classée pour les termes plus généraux, comme un nom d'équipe sportive, et les pages individuelles seront classées pour des termes plus spécifiques.
Contenu personnalisé
Chaque page de catégorie doit avoir un contenu d'introduction décrivant le sujet de la catégorie. Il doit contenir entre 200 et 400 mots et inclure quelques liens vers les meilleurs articles ou produits de la catégorie. Lors de la rédaction de ce texte, réfléchissez au contexte dont vos utilisateurs auraient besoin et au type d'intention de recherche qui les amènerait sur cette page. Il est également recommandé d'ajouter une image pouvant illustrer le sujet.
En dessous, vous pouvez afficher la liste des articles de cette catégorie, avec une image, un titre et un bref résumé du contenu.
Balises de titre et de méta description
Un titre et des balises de description méta uniques et bien conçus seront utiles pour générer des clics à partir de la page de résultats du moteur de recherche. Au lieu d'écrire pour Googlebot, répondez aux besoins de l'utilisateur potentiel.
Stratégie de mots-clés pour les pages de catégories
La recherche de mots-clés peut être un outil utile pour construire votre système de taxonomie et organiser votre contenu, mais elle doit être validée par des recherches auprès d'utilisateurs réels, pour s'assurer que la taxonomie correspond à leur modèle mental.
Les pages de catégorie doivent cibler des mots-clés larges et généraux pour éviter que les pages individuelles ne se concurrencent pour se classer. Les pages individuelles doivent concentrer leur optimisation sur des termes plus spécifiques à l'intérieur de ce domaine thématique.
Erreurs courantes de taxonomie SEO
Trop de catégories ou de tags
Lorsqu'un système de taxonomie n'est pas géré et que les auteurs peuvent créer de nouvelles catégories ou balises, il y aura une explosion de termes de taxonomie. Les auteurs utiliseront différentes variantes d'un terme comme balise, et il n'y aura aucune cohérence dans l'approche de catégorisation. Instagram est un exemple de site où les utilisateurs contrôlent les balises à utiliser et peuvent en créer une quantité apparemment infinie.
Cela rend très difficile pour les utilisateurs d'accéder au contenu qu'ils souhaitent et crée des problèmes de duplication de contenu et d'archivage avec très peu de contenu.
Il y a deux solutions possibles à cela :
- Implémentez un système de taxonomie descendant, où les auteurs ou les utilisateurs doivent choisir parmi une liste prédéfinie de catégories et de balises. Au niveau de la catégorie, c'est l'approche utilisée par les éditeurs de nouvelles depuis que les journaux sont nés. C'est aussi la même approche utilisée par les bibliothèques. Un élément de contenu appartient soit à la politique, soit à l'économie. Un livre peut être sur le crime mais pas sur la romance.
- L'autre option consiste à effectuer un exercice de regroupement de sujets, où les auteurs ou les utilisateurs ont la liberté de marquer comme ils le souhaitent, mais ces balises ne créent pas de pages d'archives individuelles et sont plutôt regroupées dans des sujets avec d'autres balises similaires. Le site de fan fiction Archive of Our Own dispose d'une équipe de bénévoles dévoués qui regroupent les balises. Le Huffington Post, quant à lui, a utilisé la technologie sémantique pour nettoyer son système de marquage. Leurs résultats : « Des pages de balises/sujets plus utiles et faisant autorité ; Amélioration de l'exploration et du classement des pages ; Meilleure analyse de contenu et récupération de contenu.
Lorsque les auteurs choisissent des balises, cela rend plus difficile leur application, car le nombre de balises possibles dans un domaine thématique est extrêmement important.
Il peut aussi devenir obsolète très rapidement. Les directives de balisage ou un champ de saisie semi-automatique avec des suggestions de balisage est une autre implémentation plus douce de cette solution. Par exemple, il peut suggérer le tag "Los Angeles Lakers", mais il ne peut pas empêcher l'auteur d'utiliser "LA Lakers" ou "Lakers" à la place.
L'application d'IA devient de plus en plus accessible à un plus large éventail d'éditeurs. Par exemple, ClassifAI est un plugin WordPress qui ajoute automatiquement des balises au contenu via des services d'IA basés sur le cloud comme IBM Watson et Microsoft Azure.
Contenu de nos partenaires
Duplication de contenu
Avoir trop de catégories ou de balises a un impact négatif sur l'expérience utilisateur, car il est plus difficile de trouver le contenu recherché par l'utilisateur. Mais cela a également un impact sur le référencement. Avoir un contenu similaire sur les mêmes sujets dans plusieurs pages d'archives vous empêche de classer une page d'archives forte sur ce sujet. Il dilue également votre autorité d'actualité.
Vous pourriez également être confronté à un problème de duplication de contenu si les moteurs de recherche indexent toutes vos archives de balises. Dans ce cas, le même article pourrait faire partie de l’archive de plusieurs balises. Il est recommandé d'appliquer une balise méta sans index pour demander aux robots des moteurs de recherche d' explorer , mais pas d'indexer, certaines de ces pages d'archives particulières.
Par exemple, un site sportif peut décider d'autoriser les moteurs de recherche à indexer ses archives de tags pour Stephen Curry (une superstar NBA des Golden State Warriors) tout en excluant de l'index la page d'archives d'Alfonzo McKinnie (un joueur un peu moins brillant sur le même équipe).
Contenu léger sur les archives
Une prolifération sauvage de termes de taxonomie conduira inévitablement à des pages d'archives qui ont trop peu de contenu pour justifier leur existence. Une page d'archives avec très peu d'articles ne sera pas utile à l'utilisateur et n'enverra pas un signal d'autorité thématique fort aux robots des moteurs de recherche.
La recommandation, dans ce cas, est de voir si le tag peut être fusionné avec un autre ("LA Lakers" et "Lakers" par exemple). Si la balise est unique mais a toujours un contenu très faible, la recommandation est d'appliquer une balise meta sans index à la page d'archive, pour éviter la concurrence avec les articles individuels.
Autres erreurs de taxonomie
Il existe d'autres erreurs courantes que les gens peuvent commettre lors de l'application d'un système de taxonomie pour organiser le contenu, ce qui aura un impact négatif sur le référencement :
- Catégories et balises dupliquées : si un site d'actualités a une catégorie pour « Espagne », il n'est pas non plus nécessaire d'ajouter une balise « Espagne ». Cela créera une mauvaise expérience utilisateur et les deux taxonomies se feront concurrence dans les résultats de recherche.
- Les catégories qui devraient avoir une relation hiérarchique sont plates à la place. Dans cet exemple, la catégorie « Espagne » doit être un nœud enfant de la catégorie parente « Europe ».
- Catégories qui devraient être des balises et vice versa. En règle générale, les catégories et sous-catégories classent le contenu en termes généraux ("Politique", "Sports"), tandis que les balises sont les sujets spécifiques couverts dans l'élément de contenu ("Primaire démocratique", "Playoffs NBA 2019").
- Ignorer l'utilisateur. Utilisez des personas et effectuez des recherches auprès des utilisateurs pour valider vos décisions de taxonomie. Aligner votre taxonomie sur le modèle mental de l'utilisateur créera une meilleure expérience utilisateur et votre site sera mieux positionné pour répondre à son intention de recherche.
- Chaque élément de contenu a sa propre place. Le contenu est accessible à partir de plusieurs chemins. C'est une bonne pratique, car cela vous permet d'aligner votre navigation sur différents utilisateurs. Mais chaque élément de contenu individuel doit avoir une URL unique et unique. Un site de commerce électronique, par exemple, pourrait avoir le même short sous Randonnée, Camping ou Fitness. Mais l'URL du short doit toujours être la même.
Conclusion
Les taxonomies sont des systèmes qui nous permettent d'organiser et de donner un sens à un ensemble de contenu donné. Cette organisation répond à deux objectifs principaux :
- Facilitez aux utilisateurs la découverte et l'accès à votre contenu, l'utilisation et la navigation sur votre site. Une bonne taxonomie accompagne alors l'utilisateur dans la réalisation de ses objectifs.
- Facilite la découverte et l'indexation de votre contenu par les robots. Une bonne taxonomie aidera les moteurs de recherche à comprendre votre site afin qu'il puisse présenter votre contenu aux requêtes de recherche pertinentes.
Un système de taxonomie peut soutenir votre stratégie de référencement en organisant le contenu plus efficacement, en évitant la duplication de contenu et en présentant une structure qui peut montrer l'autorité thématique pour votre domaine de contenu.
L'avantage d'une bonne architecture de l'information est souvent négligé et représente une formidable opportunité pour les éditeurs de mieux se positionner dans les moteurs de recherche.