Dans ce qui est l’un des sujets de référencement les plus intéressants et les plus débattus, il s’avère, peut-être sans surprise, que comme pour tout, Google applique son jugement et ne pénalise pas automatiquement le contenu en double, qu’il se trouve dans les pages de votre site Web ou dans le contenu du Web. John Mueller, responsable de l’équipe des relations de recherche chez Google, a récemment confirmé que les algorithmes des moteurs de recherche ne notaient pas négativement le contenu répété sur les pages.

La citation exacte:

«Avec ce type de contenu dupliqué, ce n’est pas tant qu’un score négatif y est associé. C’est plus que, si nous trouvons exactement les mêmes informations sur plusieurs pages sur le Web et que quelqu’un recherche spécifiquement cette information, nous essaierons de trouver la meilleure page correspondante.

Donc, si vous avez le même contenu sur plusieurs pages, nous n’afficherons pas toutes ces pages. Nous essaierons d’en choisir un et de le montrer. Ce n’est donc pas qu’il y ait un signal négatif associé à cela. Dans de nombreux cas, il est normal que vous ayez une certaine quantité de contenu partagé sur certaines pages. »

Quand le contenu dupliqué est-il OK (indice: il ne s’agit pas d’originalité, mais de qualité et de contexte)

La règle de base: rappelez-vous ce que Google essaie de comprendre – c’est ce que les gens recherchent et quelle est la meilleure page pour y répondre.

Ainsi, pour des éléments tels que le contenu standard (de courts paragraphes standardisés tels que des déclarations «à propos de nous» que vous pouvez finir par ajouter à de nombreux articles de blog, RP et pages), des descriptions de produits, des pieds de page de sites Web, des pages de destination et d’autres fonctionnalités « Blocs de contenu substantiels dans ou entre des domaines qui correspondent complètement à d’autres contenus ou qui sont sensiblement similaires » (directement de la bouche du cheval), il est en fait normal d’avoir une certaine quantité de contenu en double. La bonne nouvelle est que Google en tient compte et le gère sans nuire délibérément à votre score de classement.

En d’autres termes, votre passe-partout «à propos de nous» des milliards de fois sur le Web n’est pas un problème. Tout comme vos textes juridiques sur le site Web ne le sont pas. Cela ne crée pas de confusion, les gens ne recherchent pas cela. Et s’ils le sont, Google décide quelle page il est le plus logique d’afficher.

La mauvaise nouvelle est que ce n’est qu’un facteur de l’expérience de recherche plus large et plus large, ce qui signifie que vous n’obtenez pas de laissez-passer gratuit ici – vous devez toujours tenir compte de l’intention de recherche et de la façon dont ce que vous publiez est au meilleur service de cela.

Je vais méta sur le contenu en double ici avec un exemple de la façon dont le jugement est appliqué même lorsque Google affiche potentiellement des résultats qui l’emportent sur son propre contenu sur le blog Google pour des raisons de qualité. Le contexte (et la méta partie) cite:

«Et parfois, la personne qui l’a écrit en premier n’est pas celle qui, par exemple, est la plus pertinente.

Nous le voyons donc souvent, par exemple avec nos propres articles de blog où nous écrirons un article de blog et nous mettrons les informations que nous voulons partager sur notre article de blog et quelqu’un copiera ce contenu et il ajoutera beaucoup de des informations supplémentaires autour de lui.

C’est comme, voici ce que Google veut vraiment vous dire et c’est comme lire entre les lignes et le secret des algorithmes de Google.

Et quand quelqu’un cherche, c’est comme s’il voulait peut-être trouver la source originale. Peut-être veulent-ils trouver cette exploration plus élaborée… du contenu lui-même.

Donc, ce n’est pas parce que quelque chose est original que c’est celui qui est le plus pertinent lorsque quelqu’un recherche cette information. «

Gâcher la fête un gros – choses à considérer

En fin de compte, vous ne pourrez pas décider quelle version est la plus pertinente pour une requête de recherche spécifique, car Google le fait pour vous. À leur tour, les liens, les métriques de contenu et autres signaux de classement appliqués par les moteurs de recherche ne seront pas crédités sur l’URL souhaitée.

En outre, les pages avec plusieurs versions du même contenu souffrent d’une faible visibilité, qui peut être encore affinée avec d’autres sites qui ont du mal à distinguer le meilleur contenu.

Assurez-vous de ne pas essayer d’être intelligent et de bloquer l’accès au contenu en double, vous ne vous rendrez qu’un mauvais service. Si Google ne peut pas explorer toutes les pages avec un contenu en double, il ne peut pas consolider tous ses signaux de classement et commence donc à traiter ces pages comme distinctes et uniques. Utilisez le rel = « canonique » élément de lien pour marquer les URL spécifiques comme des doublons afin qu’elles soient traitées comme des copies.

Un mot d’avertissement: n’en abusez pas. Google pénalise toujours le contenu qui est délibérément dupliqué dans le but de manipuler les utilisateurs et, à ce titre, les classements. Le pire qui puisse arriver ici est que le site est entièrement supprimé du moteur de recherche et n’apparaît plus dans les résultats de recherche.

Qu’en est-il de la duplication de contenu sur des plates-formes de syndication telles que Medium et Business 2 Community?

Le dilemme connu est que cela offre une bonne portée, mais comme ils n’utilisent pas de canonique, il est effrayant d’être pénalisé dans le pire des cas, et dans le meilleur scénario, d’être cannibalisé pour les mêmes mots-clés que votre article d’origine cible. Google déclare:

« Syndiquez soigneusement: Si vous syndiquez votre contenu sur d’autres sites, Google affichera toujours la version que nous pensons la plus appropriée pour les utilisateurs dans chaque recherche donnée, qui peut ou non être la version que vous préférez. Cependant, il est utile de s’assurer que chaque site sur lequel votre contenu est syndiqué inclut un lien vers votre article d’origine. «

Nous avons contacté l’équipe de la communauté Business 2, voici ce qu’ils avaient à dire à ce sujet:

«En ce qui concerne la gestion du contenu syndiqué, Google propose une variété d’options à prendre en compte par les propriétaires de sites et chaque option a ses avantages et ses inconvénients. Ces options comprennent:

Pas d’indexation complète du contenu

Fournir un lien dans le corps de l’article vers la source d’origine

Utilisation d’une balise canonique

Sur la base de nos recherches et de nos années d’expérience dans l’industrie, nous avons choisi de fournir un lien dans le corps du message vers la source d’origine. Au bas de chaque élément de contenu syndiqué sur notre site, vous verrez ce qui suit:

« Cet article a été initialement publié sur (insérer le nom du blog / lien hypertexte) et a été republié avec autorisation.« »

Cela correspond assez bien à la prémisse générale dont nous discutons ici. Mon conseil – Gardez à l’esprit vos objectifs de haut niveau. si votre marque ne génère pas encore une portée massive, utilisez ces plates-formes pour passer sous le radar d’un plus grand nombre de personnes. Google ne vous pénalisera pas pour cela et afficher un rang ou deux sous medium ou business2community sous certains mots clés, tout en étant crédité pour cela peut ne pas être une mauvaise chose dans le schéma général des choses.

Naviguer techniquement dans le contenu dupliqué

En dehors de rel = canonique étiquetage, voici les bonnes pratiques pour indiquer votre page préférée à Google:

Utilisez les redirections 301 pour renvoyer une page dupliquée à la page d’origine et éviter qu’elles ne se concurrencent.

Définissez le domaine préféré et / ou la gestion des paramètres pour indiquer à Googlebot comment explorer et traiter les différents paramètres d’URL. Cela peut être défini via Google Search Console.

Soyez cohérent avec votre lien interne. L’absence de «www» ou «/» peut faire une différence comme http://www.example.com/page/, http://www.example.com/page et http://example.com/page / sont trois pages différentes dans ce cas.

Apprenez à savoir comment et où votre CMS affiche le contenu afin de réduire également les répétitions dans différents formats (par exemple, les aperçus).

Ajoutez un peu de voix et de personnalité avec votre libellé pour créer un contenu unique.

Résumer les choses

Au fil du temps et de l’évolution de Google, l’accent mis sur l’expérience et l’intention de l’utilisateur s’étend. Ne mettez aucune décision sur le pilote automatique et ne vous en tenez pas aux règles techniques empiriques. La vue d’ensemble de haut niveau devrait vous guider. Les choses ne sont pas binaires. Le contenu dupliqué n’est pas entièrement faux, le contexte et l’intention sont ce qui compte.