Re : Courtier en travaux dans le Tarn: site Joomla 2.5
Bonjour,
...Bonne nouvelle !
...Bonne question (je vous remercie de me l'avoir posée ).
Il y a sur ce point précis (= réseaux sociaux et duplicate content) 2 théories d'ensemble. En effet :
A mon avis :
Les algorithmes de Google changent sans cesse (paraît-il 400 fois par an, soit plus d'une fois par jour), mais la « logique » qui détermine ces calculs n'a jamais changé : fournir aux internautes les contenus les plus pertinents en fonction de leurs requêtes. Or la pertinence s'évalue en termes de richesse, mais aussi d'originalité.
Dès lors, on comprend bien la chasse au duplicate content à laquelle se livrent les moteurs : les contenus multi-diffusés encombrent les SERP (= les pages de résultats des moteurs de recherche), faussent les résultats (= le classement des sites dans les SERP)... et finalement leur présence dans les SERP ne satisfait pas du tout les internautes, elles leur fait perdre du temps, les déçoit voire les énerve.
Donc mon avis est qu'il convient d'éviter le duplicate content en général, donc y compris entre un site et son compte Facebook.
Il y a cependant des nuances à apporter à cette affirmation :
Une autre remarque encore : étant entendu que le principe de Google est la satisfaction des internautes, Google n'est pas un dieu incompréhensible, Google c'est vous et moi.
=> Regardez-vous surfer, et vous comprendrez comment Google opère pour fournir un ordre d'arrivée.
Quelques exemples :
Appliquez cette dernière règle à l'inclusion de contenus Facebook sur un site : placez ces contenus en bas de page plutôt qu'en haut. L'impact d'un éventuel duplicate content sera ainsi moins sensible.
Enfin, une précaution à ne pas négliger, même si elle ne concerne peut-être pas le cas en question : en cas de forte ressemblance entre plusieurs pages, il est toujours possible, et dans certains cas recommandé, d'indiquer aux moteurs de recherche quelle est la page canonique.
« What is a canonical page? » me demanderez-vous — éventuellement en français. Réponse de Matt Cutts, l'un des gourous de la SEO employé par Google : « A canonical page is the preferred version of a set of pages with highly similar content » (http://support.google.com/webmasters...&answer=139394). Autrement dit, une page marquée comme canonique est une page de référence, la page mère parmi un ensemble de pages au contenu similaire ou très proche.
Concrètement, il est possible d'indiquer aux moteurs de recherche qu'une page est canonique, donc « préférée » par rapport à d'autres de contenu similaire ou très proche, donc en principe le contenu source, original, évitant ainsi toute sanction liée à la production — volontaire ou non — de duplicate content, ou du moins d'éviter que Google ne prenne une mauvaise décision (= une décision qui ne convient pas au webmaster).
Le procédé s'appelle canonicalisation (terme consacré, même s'il n'est pas très commode à prononcer... surtout rapidement ).
L'instruction est de type :
pour une page page-canonique du site site123.fr et se place dans l'en-tête des pages au contenu dupliqué (= entre <Head> et </Head>.
Pour insérer ce code dans une page Joomla, il est possible d'utiliser une extension généraliste permettant d'insérer n'importe quel code* (Javascript / CSS ou autre) dans l'en-tête des documents, ou bien une extension spécifique (http://extensions.joomla.org/extensi...onicalization-).
Attention cependant : à réserver aux pages dont le contenu est quasi identique.
Pour en savoir plus sur la canonicalisation (ou canonicaliZation) : http://support.google.com/webmasters...&answer=139066 (en français).
Bonne continuation,
PhilJ
* Personnellement, j'utilise Jostag d'Infograf768. Le code s'insère directement dans l'éditeur Joomla de la façon suivante :
(Remarquez l'absence des signes < et />, et la présence d'une espace à la fin, devant {/tag})
Bonjour,
Envoyé par kdoussaint
Voir le message
concernant les publications Facebook, celles-ci sont elles prises en compte pour le duplicate ?
...Bonne question (je vous remercie de me l'avoir posée ).
Il y a sur ce point précis (= réseaux sociaux et duplicate content) 2 théories d'ensemble. En effet :
- Il est possible de penser que Google (comme peut-être d'autres moteurs de recherche) sait tenir compte du contexte : une page Facebook explicitement liée à un site internet n'est pas ce site internet mais sa projection dans un espace social distinct — distinct signifiant non pas séparé, mais lié sans être identique. Selon cette théorie, il n'y aurait donc aucun risque lié à un duplicate content entre un site et sa promotion sur les médias sociaux.
— - Cependant :
- Il est difficile d'être sûr que Google opère vraiment cette distinction.
- Même si cette distinction est faite par le moteur, rien ne dit qu'elle ne connaît pas des limites : il y a en effet duplicate content et... duplicate content (décidément, c'est bien un message sur le duplicate content !). Notamment : le contenu est-il totalement dupliqué, ou bien seulement partiellement ?
- Enfin, il ne faut pas oublier qu'internet est fait pour les visiteurs, pas pour les moteurs : à quoi bon proposer deux versions de son site sur internet ? Les internautes peuvent-ils vraiment apprécier cette duplication du même contenu ?
A mon avis :
Les algorithmes de Google changent sans cesse (paraît-il 400 fois par an, soit plus d'une fois par jour), mais la « logique » qui détermine ces calculs n'a jamais changé : fournir aux internautes les contenus les plus pertinents en fonction de leurs requêtes. Or la pertinence s'évalue en termes de richesse, mais aussi d'originalité.
Dès lors, on comprend bien la chasse au duplicate content à laquelle se livrent les moteurs : les contenus multi-diffusés encombrent les SERP (= les pages de résultats des moteurs de recherche), faussent les résultats (= le classement des sites dans les SERP)... et finalement leur présence dans les SERP ne satisfait pas du tout les internautes, elles leur fait perdre du temps, les déçoit voire les énerve.
Donc mon avis est qu'il convient d'éviter le duplicate content en général, donc y compris entre un site et son compte Facebook.
Il y a cependant des nuances à apporter à cette affirmation :
- Comme déjà indiqué, le duplicate content peut être total ou partiel. Ce qu'il faut éviter, c'est le duplicate content total. Rien n'empêche donc a priori, par exemple, (a) d'insérer dans Facebook seulement le début d'un article d'un site, avec un lien pour lire la suite pointant sur l'article du site, ou encore (b) de paraphraser l'article du site, ou (c) d'en proposer un résumé dans une page Facebook (tout en posant là aussi un lien vers l'article complet du site).
— - Comme leur désignation l'indique clairement, les réseaux sociaux sont des médias interactifs, des plateformes de dialogue. Les pages Facebook (comme celles des autres réseaux sociaux) ne devraient donc pas se réduire à la simple duplication d'un contenu déjà présent sur un autre média, en l'occurrence sur un autre site internet. Autrement dit, un compte Facebook efficace devrait être vivant, animé par des échanges. En gardant à l'esprit cette mission d'interaction des réseaux sociaux, la question du duplicate content ne devrait pratiquement même plus se poser.
Une autre remarque encore : étant entendu que le principe de Google est la satisfaction des internautes, Google n'est pas un dieu incompréhensible, Google c'est vous et moi.
=> Regardez-vous surfer, et vous comprendrez comment Google opère pour fournir un ordre d'arrivée.
Quelques exemples :
- La plupart du temps, les pages sont « scannées » (= balayées du regard, en quelque sorte parcourues en diagonale) avant d'être vraiment lues. Si aucun « point d'appui » n'est prévu facilitant ce premier parcours, l'internaute risque de se décourager et de cliquer la petite croix en haut à droite (= la porte de sortie). D'où la valorisation par Google des titres & des sous-titres (= 1 balise <H1> + plusieurs balises <H2>, <H3>...), ainsi que des termes dont la typographie est différenciée (notamment avec <strong> ou <em>).
— - Un deuxième exemple, cette fois directement transposable pour penser le rapport entre le site et les réseaux sociaux : les européens écrivent, et donc lisent, de gauche à droite, et de haut en bas. En outre, le haut de la page s'affiche systématiquement avant le bas de la page. A votre avis, quelles sont donc les zones les plus favorisées par Google au point de vue référencement / SEO ? => Celles qui sont les plus vues et les plus lues... à commencer bien sûr par la zone située en haut à gauche, loin devant le bas de la page. Et, bien sûr aussi, le haut de la page d'accueil (presque toujours consultée) pourra valoir bien plus que le haut d'un article qui n'est accessible qu'en 2e ou 3e niveau de profondeur.
Appliquez cette dernière règle à l'inclusion de contenus Facebook sur un site : placez ces contenus en bas de page plutôt qu'en haut. L'impact d'un éventuel duplicate content sera ainsi moins sensible.
Enfin, une précaution à ne pas négliger, même si elle ne concerne peut-être pas le cas en question : en cas de forte ressemblance entre plusieurs pages, il est toujours possible, et dans certains cas recommandé, d'indiquer aux moteurs de recherche quelle est la page canonique.
« What is a canonical page? » me demanderez-vous — éventuellement en français. Réponse de Matt Cutts, l'un des gourous de la SEO employé par Google : « A canonical page is the preferred version of a set of pages with highly similar content » (http://support.google.com/webmasters...&answer=139394). Autrement dit, une page marquée comme canonique est une page de référence, la page mère parmi un ensemble de pages au contenu similaire ou très proche.
Concrètement, il est possible d'indiquer aux moteurs de recherche qu'une page est canonique, donc « préférée » par rapport à d'autres de contenu similaire ou très proche, donc en principe le contenu source, original, évitant ainsi toute sanction liée à la production — volontaire ou non — de duplicate content, ou du moins d'éviter que Google ne prenne une mauvaise décision (= une décision qui ne convient pas au webmaster).
Le procédé s'appelle canonicalisation (terme consacré, même s'il n'est pas très commode à prononcer... surtout rapidement ).
L'instruction est de type :
Code:
<link rel="canonical" href="http://www.site123.fr/page-canonique" />
Pour insérer ce code dans une page Joomla, il est possible d'utiliser une extension généraliste permettant d'insérer n'importe quel code* (Javascript / CSS ou autre) dans l'en-tête des documents, ou bien une extension spécifique (http://extensions.joomla.org/extensi...onicalization-).
Attention cependant : à réserver aux pages dont le contenu est quasi identique.
Pour en savoir plus sur la canonicalisation (ou canonicaliZation) : http://support.google.com/webmasters...&answer=139066 (en français).
Bonne continuation,
PhilJ
* Personnellement, j'utilise Jostag d'Infograf768. Le code s'insère directement dans l'éditeur Joomla de la façon suivante :
Code HTML:
{tag}link rel="canonical" href="http://www.site123.fr/page-canonique {/tag}
Commentaire