Pinailler le duplicate content

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [RÉGLÉ] Pinailler le duplicate content

    Bonjour à tous,

    Après avoir testé quelques extensions pour implémenter une balise canonical dans mes pages, sans être vraiment séduit par ce que j'ai vu, j'ai tenté de me rabattre vers un morceau de code à placer dans le .htaccess et qui va nettoyer les urls de mon site de leur appendice /index.php. j'étais tellement content que cela fonctionne que j'ai bu une bière.

    Malheureusement, peu de temps après, en lançant une recherche site: dans Google, je constate que celui-ci enregistre certaines pages avec un / à la fin et d'autres sans.

    J'en suis à présent à ma 7ème bière et j'ai l'impression de tourner en rond.

    Mon template propose de placer une balise canonical dans le code des pages mais comme pour la plupart des extensions, ce n'est qu'une sombre copie de l'URL, avec tous ses défauts. Le plugin intégré à Joomla! ne fait lui, pas mieux.

    Vous en êtes où avec votre duplicate content, vous ?
    "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
    https://www.graphiquedesign-bf.com/

  • #2
    J'ai laissé la bière !
    J'ai arrangé la partie Rewrite de mon fichier .htaccess afin qu'il redirige systématiquement les pages dont l'url se termine par index.php vers une url sans index.php, ça c'est fait ! Puis j'ai encore ajouté une couche de code afin que cette fois ci, il redirige les page dont l'url se termine par un / vers une page sans /. Normalement, ça devrait être bien vu par les Googles et autres ! Voici ce que ça donne ... On force le https, également le www, on vire le index.php, également le / que l'on retrouve par moment en fin d'url.

    Code:
    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteCond %{HTTPS} !=on
    RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
    RewriteCond %{HTTP_HOST} !^www\.
    RewriteRule ^ https://www.%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
    RewriteCond %{REQUEST_URI} !^.*/administrator/index\.php [NC]
    RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /(.*)index\.php($|\ |\?) [NC]
    RewriteRule ^ /%1 [R=301,L]
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteCond %{REQUEST_URI} (.+)/$
    RewriteRule ^ %1 [R=301,L]
    </IfModule>
    Voilà, j'accepte les commentaires !
    Merci.
    "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
    https://www.graphiquedesign-bf.com/

    Commentaire


    • #3
      Tiens, avec ce code dans le .htaccess, j'ai JComments qui ne fonctionne plus !
      Bizarre, bizarre, bizzzzarre !
      "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
      https://www.graphiquedesign-bf.com/

      Commentaire


      • #4
        Visiblement, pas trop de succès avec mon topic !
        Quand Google indexe vos pages, certaines avec un / en fin d'url et d'autres, sans / en fin d'url, ça ne vous fait rien ?
        "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
        https://www.graphiquedesign-bf.com/

        Commentaire


        • #5
          Question intéressante, et, première fois que je la vois, bien que j'ai déjà pu sorvoler de nombreux sujets.
          N'hésite pas à repasser compléter, si tu trouves plus d'informations.

          Commentaire


          • #6
            Envoyé par GraphiqueDesign Voir le message
            Visiblement, pas trop de succès avec mon topic !
            Quand Google indexe vos pages, certaines avec un / en fin d'url et d'autres, sans / en fin d'url, ça ne vous fait rien ?
            GraphiqueDesign.

            Je pense que Google sait comprendre le / dans les url comme étant un séparateur menant vers un chemin de répertoire du site sans l'assimiler à du duplicate content.

            De même qu'il sait que .com et .com/index.php sine une seule et même page. Je n'ai en tous cas pas de duplicate content signalé dans ma console alors que je n'ai pas de règle spécifiques en place à ce sujet.

            Bonne journée.
            crapouille63 aime ceci.
            Cordialement.
            __
            Eddy !!!
            Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

            Commentaire


            • #7
              C'est un site de vérification SEO qui me signalait cette erreur en la gratifiant d'une note affligeante ! Mais certainement qu'il dramatise un peu les choses, tout comme cet autre site qui signale très négativement la présence d'une paire de balise h1 dans une même page. Merci Eddy.
              "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
              https://www.graphiquedesign-bf.com/

              Commentaire


              • #8
                Pour le H1, je suis d'avis de n'en avoir qu'une par page, c'est LE titre de la page…
                Cordialement.
                __
                Eddy !!!
                Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                Commentaire


                • #9
                  Envoyé par Eddy.vh Voir le message
                  Pour le H1, je suis d'avis de n'en avoir qu'une par page, c'est LE titre de la page…
                  Et pourtant, Olivier Andrieux (Abondance) affirme qu'il n'y a aucune règle stricte sur le nombre de balises h1 !
                  Un autre site a fait un test et ohhhh surprise, la page avec 2 balise h1 est sortie vainqueur.

                  En fait, une autre source me dit que de s'en tenir qu'à une seule balise h1 est une idée qui date d'une autre époque. Il est vrai que nos habitudes, on y tient même quand le contexte a beaucoup changé. Il m'arrive régulièrement d'avoir à remettre en question certaines pratiques acquises ... autrefois.
                  "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                  https://www.graphiquedesign-bf.com/

                  Commentaire


                  • #10
                    Mais c'est parfait.

                    Je suis mon instinct et chacun doit faire de même. Si deux éléments dans une même page ont une même importance, pourquoi pas même si je reste dubitatif ?

                    Parce que d'importance il s'agit, sinon à quoi sert-il d'avoir 6 niveaux dans les titres.
                    Cordialement.
                    __
                    Eddy !!!
                    Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                    Commentaire


                    • #11
                      Je pense que utiliser une seule balise H1 peut trouver son sens, lorsque l'on utilise des lecteurs d'écran, pour les mal voyant et les aveugles.
                      Il est important de bien structurer sa page pour les lecteurs d'écran et les navigateurs texte.

                      Sinon, j'avais moi aussi par le passé, des cas ou j'avais plusieurs fois les balises H1 dans la page, et, effectivement, elle n'était pas pour autant déclassée. Le H1 est censé signaler que l'information est un titre de premier niveau, donc, une information importante, comme le dit Eddy, le titre de la page ou du tutoriel en règle générale. On peut penser que répéter la balise H1 pourrait être une méthode de seo pour optimiser son positionnement, ce n'est pas impossible, mais, ça ne répond pas aux standards conseillés.

                      Commentaire


                      • #12
                        Merci ZerooCool,
                        En fait, je ne trouve aucun site qui conseille clairement de s'en tenir à une seule balise h1 ! J'ai moi-même toujours appliqué cette "règle" jusqu'au jour où un développeur de chez Joomhaper m'a demandé pourquoi je faisais cela et quel standard du Web préconisait cela. Je suis parti voir chez Abondance qui pour moi est une référence en la matière et effectivement, il confirme qu'il n'existe aucune règle en la matière. Si dans une page, on a juste un article, il semble évident qu'une seule balise h1 sera présente (le titre de l'article). Mais sur une page produits par exemple, on peut très bien avoir 2 voire 3 axes de communication qui nécessiteront chacune une balise h1, elle même suivie de h2 et de h3.

                        En fait, le conseil le plus judicieux que j'ai trouvé, c'est d'affilier une balise h1 à ce qui est assez important pour en justifier l'usage.

                        On trouve à peu prêt une même discussion concernant l'ordre de placement des balises dans la page. La balise h1, doit elle forcément être, chronologiquement, la première balise en place dans la page ou une page, peut elle commencer avec une balise h2 puis arriver sur une balise h1 ?
                        "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                        https://www.graphiquedesign-bf.com/

                        Commentaire


                        • #13
                          Je ne souhaite pas discuter les propos de Abondance mais si je fais une rapide recherche sur la balise h1 sur monsieur Google (pour ne citer que lui), que je scrute les premiers résultats (yakaferci, webrankinfo, referenseo, etc.), je trouve quand-même sur chacun des articles l'importance de respecter les niveaux de titres et que le h1 ne devrait apparaître qu'une fois par page afin de bien cibler le titre de la page et son importance pour cette dernière.

                          Bref, de mon point de vue, je pense qu'il soit inutile d'avoir plus d'une H1 dans une page, chaque section pouvant recevoir un H2 et les sous-sections un H3, etc.
                          Cordialement.
                          __
                          Eddy !!!
                          Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                          Commentaire


                          • #14
                            Bahhh, le sujet est assez vaste pour que l'on puisse y confronter nos avis, paisiblement. Parce qu'en allant chez webrankinfo justement, j'y ai trouvé ce lien qui affirme clairement qu'en html5 : https://blog.lesieur.name/les-balise...sees-en-html5/
                            "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                            https://www.graphiquedesign-bf.com/

                            Commentaire


                            • #15
                              Bonjour à tous,

                              échange très intéressant :-)

                              # duplicate
                              Pour la partie nettoyage via .htaccess, je ne peux pas aider
                              Dans la pratique, j'ai fait l'impasse de xxx/ < vs > xxxx
                              Constat: ça n'empêche absolument pas le positionnement d'un de mes sites en 1ère page (secteur non concurrentiel et non pollué par l'influence d'achats de mots clés, je précise)

                              # balisage H1
                              Je conseille d'élargir de le point de vue, aux différents angles de caméra:

                              1 - W3C:
                              définit un ensemble de règles relevant à la fois de la technique et de la bonne pratique "à l'intention de l'utilisateur final"

                              2- GOOGLE:

                              Impose SES propres règles, en avançant l'argument "utilisateur final", POUR fagociter l'économie des éditeurs internet.
                              Particulièrement efficace en France où nous sommes devenus très Google dépendants.
                              Et le GAFA ne s'y est pas trompé car il développe les partenariats en tous sens avec des influenceurs économiques (Conseils régionaux, Instituions diverses et variées)

                              Même s'il ne respecte pas lui-même les règles qu'il nous impose.
                              Exemple type > met la pression sur les éditeurs pour le développement de versions mobiles de leurs sites. Mais ne sait pas "lire" une appli mobile ...

                              Néanmoins, comme les français sont google dépendants, il faut en passer par là.

                              La préconisation de Google est de n'avoir qu'un seul TAG H1 par page avec:
                              > ( [ tag h1 ] = Titre de la page) + ( cohérent avec le <title> ) + ( cohérent avec le contenu "métier")

                              Ex: une page avec un h1 + <title> qui disent "le grand duc à perruque orange" ne doit pas raconter l'histoire du "chat vert à pois rose")

                              3- L'utilisateur:

                              Un titre de page = le sujet qu'on va traiter.

                              Sous-titre, sous-sous-titre etc. et paragraphe: le traitement du sujet (présentation / hypothèse / argumentation / conclusion)
                              Bref, comme on faisait à l'école pour les épreuves de bac en français)

                              Google, au passage, appuie cette conception du contenu (argument utilisateur final >> on peut le suivre aussi)

                              Utilisateur: quoi de plus lassant que:
                              - d'avoir des pages hyper longues
                              - d'avoir des Titres à répétition (surtout si la charte css les colle en Big-Big size + couleurs pétentes)
                              - lire une page qui traite de plusieurs sujets > plusieurs sujets = 1 thèse, 1 roman, 1 dossier... pas 1 article

                              4- le joker HTML 5

                              L'arrivée de HTML 5 a développé la notion de zonage de contenu > Sections: <section>, <article>, <nav>, <aside>, <header>, <footer>
                              Pour la structuration du document et l'interopérabilité des navigateurs.
                              Mais pas que.
                              L'objectif étant aussi de distinguer le contenu à valeur ajoutée pour l'utilisateur (réponse pertinente à recherche d'information), du contenu fonctionnel (charte graphique, navigation, ...) et du contenu à moindre valeur ajoutée avec liens récurrents (à propos / mentions légales...)

                              Ce qui induit que tout le contenu placé dans ces zones n'a pas le même poids / valeur sémantique que le contenu "riche" d'une page: rédactionnel + medias + liens (pertinents les medias et les liens, on ne le dira jamais assez)

                              Google a dit > moins d'incidence des tags de titres et sous-titres dans les sections.
                              D'où (serait) moins grave de dupliquer du tag <h1>, à condition que ce soit dans ces sections
                              Sauf que:
                              - entre ce que Google dit, et ce que Google fait >> y a parfois un monde, voire un univers (ou plusieurs galaxies)
                              - les choses pourraient encore changer. Google aime beaucoup changer ses règles pour nous essoufler. Et le W3C penser à une nouvel objectif utilisateur plus intéressant, souvent à bon escient (cf HTML5)

                              Dans la pratique, la mise en application d'une logique simple et orientée utilisateur m'a toujours rendu service.
                              Et c'est montré "solide" du point de vue Google, comme pour mes petits nerfs >> un seul tag <h1>

                              Bonne journée :-)
                              Dernière édition par crapouille63 à 08/02/2019, 14h19

                              Commentaire

                              Annonce

                              Réduire
                              Aucune annonce pour le moment.

                              Partenaire de l'association

                              Réduire

                              Hébergeur Web PlanetHoster
                              Travaille ...
                              X