Affichage d'article sous forme de blog : duplicate content ?

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [Problème] Affichage d'article sous forme de blog : duplicate content ?

    Bonjour,

    J'utilise un menu qui affiche une liste d'article d'une même catégorie sous forme de blog :
    http://www.chez-titi.com/accessible-...nt-aux-membres

    Est-ce que le fait que mes articles soient accessibles depuis 2 URLs différentes nuit à mon référencement, étant interprété duplicate content ?

    Merci de vos réponses,

  • #2
    Re : Affichage d'article sous forme de blog : duplicate content ?

    Bonjour,

    oui et non !

    d'abord parce que si un menu qui présente des listes de catégories ou des articles mis en vedette ou d'ailleurs toute forme de liste est susceptible (grandement) de générer du duplicate content, ce n'est (hélas) pas la seule source. En outre Google, connaît bien ce genre de comportement lié à la réécriture d'URL, particulièrement de la part des CMS et est tout à fait tolérant dans ce domaine.

    Le duplicate content provient techniquement du fait que Google gère ses archives et ses index en relation avec l'url qu'il a suivit pour arriver au contenu. Or il y a de multiples manières d'arriver à ce contenu, par exemple en ajoutant (ou pas) www devant le nom de domaine et ne ne gérant pas correctement cette redirection dans le fichier .htaccess, mais aussi en simplement ajoutant un / à la fin de l'URL (même page à l'arrivée, 2 urls différentes pour Google c'est du duplicate content).

    Les causes du duplicate content sont multiples, on peut maîtriser une partie des causes, diminuer la fréquence et le risque, mais il en restera toujours indéniablement (ne serait ce que les url contenant des paramètres du type start= ou print= ou rss etc etc...)

    Comme il y a plus de 200 critères gérés par Google pour le référencement, ne vous faites pas trop de soucis pour ce type de duplicate content (recopier le contenu d'un autre site dans vos pages, sans autorisation et vous faire prendre par la patrouille pourrait coûter plus cher en terme de référencement), dans ce cadre aucun risque.
    Le seul conseil à donner est de surveiller (via les Google Web Tools par exemple) et essayer de limiter et corriger ce qu'il est possible de corriger.

    Cordialement
    Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

    Commentaire


    • #3
      Re : Affichage d'article sous forme de blog : duplicate content ?

      Bonjour,

      Merci pour la réponse très pertinente !

      Ce que j'ai remarqué, via GWT, c'est que mon fichier map présentant les URLs souhaitées a intégralement été indexé... mais les articles - portant uniquement accessibles via le menu d'affichage sous forme de blog - ont doublement été indexées, alors qu'aucun (autre) menu ou lien ne pointe dessus...

      Autre petite question : lorsqu'un lien externe pointe sur mon domaine, cela est également différent si celui-ci est précédé d'un "/" ?

      Cordialement,

      Commentaire


      • #4
        Re : Affichage d'article sous forme de blog : duplicate content ?

        Envoyé par Mickael007 Voir le message
        Bonjour,

        Merci pour la réponse très pertinente !

        Ce que j'ai remarqué, via GWT, c'est que mon fichier map présentant les URLs souhaitées a intégralement été indexé... mais les articles - portant uniquement accessibles via le menu d'affichage sous forme de blog - ont doublement été indexées, alors qu'aucun (autre) menu ou lien ne pointe dessus...

        Autre petite question : lorsqu'un lien externe pointe sur mon domaine, cela est également différent si celui-ci est précédé d'un "/" ?

        Cordialement,
        Pour commencer, la deuxième question. Un lien qui commence par un "/" est un lien relatif, (interne en quelque sorte, portable si tu préfères) qui va être 'corrigé' ou redressé par le moteur Apache au moment de son exécution et qui se verra transformé en http://tonurldesite "/" l'url contenu dans ta page. Donc aucun risque de duplicate à cause de cela particulièrement.

        Pour la première question, cela provient de la manière dont fonctionne les bots qui parcourent ton site, Google sait parfaitement qu'en faisant de cette manière il 'risque' de provoquer du duplicate content, mais il n'a pas vraiment d'autre solution. ton sitemap lui donne des liens vers les pages, ton fichier robots.tx d'autres liens (les mêmes plus quelques autres peut être), mais surtout dans son fonctionnement (simple au demeurant), à chaque fois qu'il va examiner une page, il va 'descendre' dans toutes les pages des liens qu'il va rencontrer, et cette descente ne va pas forcément (ne va surement pas) suivre les menus que tu as préparé pour tes utilisateurs qui eux ont une démarche plus intuitive te moins robotique. Il ne rate rien, mais 'voit' des choses en double ou tout au moins différemment.

        C'est dans ce but que Google a proposé (puis imposé) l'usage des balises meta dites : canonical, pour montrer que si plusieurs pages sont identiques et apparemment dupliquées celle qui compte réellement est la page marquée et visée par la balise meta rel=canonical.

        Voir à ce sujet l'article (en français) de Google soi-même : https://support.google.com/webmaster...r/139066?hl=fr
        Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

        Commentaire


        • #5
          Re : Affichage d'article sous forme de blog : duplicate content ?

          Merci pour les explications concises, ainsi que le lien,

          Je sens que je vais devoir me pencher sur cette fameuse balise méta canonical alors...

          C'est rassurant concernant les "/", car j'ai inscrit mon URL racine dans certains annuaires, des fois avec / à la fin (en recopiant l'adresse depuis le navigateur), et des fois sans...

          Je profite de ton expertise pour poser une question un peu non-liée au sujet (dslé :
          Comment faire pour que les mots "identifiants", "mot", "oublié" appartenant à mon module d'identification ne soit pas considérés comme mots clés de contenu, via GWT ?

          Commentaire


          • #6
            Re : Affichage d'article sous forme de blog : duplicate content ?

            oup la ! ?
            Autre petite question : lorsqu'un lien externe pointe sur mon domaine, cela est également différent si celui-ci est précédé d'un "/" ?
            A la fin, c'est pas au début.
            "/" à la fin de ton url et pas de "/" à la fin sur la même url sont deux url pointant sur une même page et donc mécaniquement deux "clés" entrant dans la même serrure donc duplicate content. Un "/" en début d'url introduit une url relative au site et est donc quelque chose de totalement différent.
            Comment faire pour que les mots "identifiants", "mot", "oublié" appartenant à mon module d'identification ne soit pas considérés comme mots clés de contenu, via GWT ?
            Par la magie du contenu, Google crée lui-même ses mots-clés, tu ne peux donc pas lui interdire de considérer ces mots comme tant des mots-clés pour une url donnée. Par contre tu peux t'organiser pour que d'autres mots-clés passent 'devant', ou plutôt aient plus de poids.

            Très schématiquement, Google pèse les mots- du ocntenu de ton texte en leur pondérant une valeur selon le contexte et l'emplacement.
            Le smots-ont ainsi plus d'importance (dans l'ordre) :

            1) dans la balise <title>
            2) dans la balise <H1>
            3) dans les balises <H2> à <H9>
            4) dans les attributs <title> et <alt> des images et des urls de ta page
            5) dans le reste du texte (avec semble t il plus de poids pour le début et la fin du texte).


            Comme Google ne communique pas sur ses règles de calcul, cela reste sujet à caution (Title et H1 c'est confirmé par Google lui-même).
            Encore une fois les règles sont capricieuses, changeantes, peu ou pas documentées et il y en a sans doute entre 150 et 200 voire plus, donc règle n° 1 si je puis dire, ne pas focaliser sur une règle en particulier.

            Pour s'instruire, pas cher : http://kiwik.net/joomla/optimisation...un-site-joomla
            Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

            Commentaire


            • #7
              Re : Affichage d'article sous forme de blog : duplicate content ?

              Aie !
              Il y aurait-il une façon de faire un genre de redirection 301 (un peu comme dans le fichier htaccess, pour les avec et sans www.) pour régler le pb de "/" après l'URL ?

              Merci pour le lien, mais ma version joomla est nettement antérieure à la 3.5

              Il y a t-il une méthode pour virer les h3 des modules d'identification ?

              Commentaire


              • #8
                Re : Affichage d'article sous forme de blog : duplicate content ?

                1) oui sans doute faudrait regarder ça de près, je vais essayer de jeter un oeil

                2) la plus part des informations sont toutes versions de Joomla (peut être pas la 1.5 ou 1.7), mais globalement à part les recettes, c'est le SEO en général donc les principes d'abord

                3) virer les <h3> ke ne suis pas sur de comprendre ce que tu veux faire ?
                Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                Commentaire


                • #9
                  Re : Affichage d'article sous forme de blog : duplicate content ?

                  Merci, c'est gentil, c'est vraiment la cacophonie niveau de mes liens entrants : certains avec "/" à la fin de mes URLs, certains sans... peut-être est-ce pour cela que je n'ai que 2 liens sur un quarantaine visibles sur GWT ??

                  J'ai mal observé concernant certaines h3, je pensais que c'était à cause d'elles que les textes non-désirés figurent dans mes mots clés... alors que ce sont les texte du type "Qui est en ligne ?" qui ont été automatiquement encadrés par les balises h3... cependant, cette info n'étant pas primordiale, serait-ce judicieux de plutôt les enlever ? si oui, comment faire stp ? (elle ont été automatiquement générés...

                  Commentaire


                  • #10
                    Re : Affichage d'article sous forme de blog : duplicate content ?

                    Ou serait-il judicieux de passer les liens "identifiants", "mot", "oublié" en nofollow ? aurais-tu une idée stp ?
                    ps : dslé, je sais que ça fait bcp de questions en même temps

                    Commentaire


                    • #11
                      Re : Affichage d'article sous forme de blog : duplicate content ?

                      Désolé trop tard pour ce soir, je regarde ça demain matin
                      Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                      Commentaire


                      • #12
                        Re : Affichage d'article sous forme de blog : duplicate content ?

                        Bonjour,

                        franchement je trouve que tu t'inquiètes trop pour pas grand chose, rien de critique en tout cas. Si cela peut te rassurer, je te suggère de passer ton site dans www.yakaferci.com qui va te faire une analyse SEO gratuite, pas forcément très détaillée, mais suffisante pour avoir une idée des problèmes existants.

                        A part des balises <H3> avant la balise <H1> du fait de l'objet slider de début qui pourrait être mieux paramétré (le permet il ?), il n'y a pas de choses monstrueuses, ce qui serait bien, serait de supprimer le texte copié / collé depuis Word, outre le fait qu'il alourdit ta page pour rien (tout ce qui est inutile a été mis en commentaire lors de la copie, il est susceptible de générer des problèmes, il vaut beaucoup mieux saisir le texte avec JCE ou un autre éditeur pour optimiser ton site.

                        Ou serait-il judicieux de passer les liens "identifiants", "mot", "oublié" en nofollow ? aurais-tu une idée stp ?
                        quand à ça, je ne pense pas que cela gêne considérablement, outre que tu vas avoir du mal à empêcher le composant interne de Joomla à mettre ses liens en no follow (il faut surcharger le composant Joomla! pour cela), cela n'apportera rien de plus

                        Cordialement
                        Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                        Commentaire


                        • #13
                          Re : Affichage d'article sous forme de blog : duplicate content ?

                          Bonjour,

                          Merci encore pour ces précieux conseils,

                          Effectivement, je m'inquiète bcp qd même, car mon site est très très mal référencé, et puis c'est la tourmente, tu te poses toutes sortes de questions, à croire que t'es à coté de la plaque ou qu'il y a un big pb sur celui-ci...

                          Ok pour les textes word. Concernant le slider, pas de paramétrage de dispo pour la gestion de cela...

                          Cordialement,

                          Commentaire

                          Annonce

                          Réduire
                          Aucune annonce pour le moment.

                          Partenaire de l'association

                          Réduire

                          Hébergeur Web PlanetHoster
                          Travaille ...
                          X