Pinailler le duplicate content

Réduire
X
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [RÉGLÉ] Pinailler le duplicate content

    Bonjour à tous,

    Après avoir testé quelques extensions pour implémenter une balise canonical dans mes pages, sans être vraiment séduit par ce que j'ai vu, j'ai tenté de me rabattre vers un morceau de code à placer dans le .htaccess et qui va nettoyer les urls de mon site de leur appendice /index.php. j'étais tellement content que cela fonctionne que j'ai bu une bière.

    Malheureusement, peu de temps après, en lançant une recherche site: dans Google, je constate que celui-ci enregistre certaines pages avec un / à la fin et d'autres sans.

    J'en suis à présent à ma 7ème bière et j'ai l'impression de tourner en rond.

    Mon template propose de placer une balise canonical dans le code des pages mais comme pour la plupart des extensions, ce n'est qu'une sombre copie de l'URL, avec tous ses défauts. Le plugin intégré à Joomla! ne fait lui, pas mieux.

    Vous en êtes où avec votre duplicate content, vous ?
    "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
    https://www.graphiquedesign-bf.com/

  • #2
    J'ai laissé la bière !
    J'ai arrangé la partie Rewrite de mon fichier .htaccess afin qu'il redirige systématiquement les pages dont l'url se termine par index.php vers une url sans index.php, ça c'est fait ! Puis j'ai encore ajouté une couche de code afin que cette fois ci, il redirige les page dont l'url se termine par un / vers une page sans /. Normalement, ça devrait être bien vu par les Googles et autres ! Voici ce que ça donne ... On force le https, également le www, on vire le index.php, également le / que l'on retrouve par moment en fin d'url.

    Code:
    <IfModule mod_rewrite.c>
    RewriteEngine On
    RewriteCond %{HTTPS} !=on
    RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
    RewriteCond %{HTTP_HOST} !^www\.
    RewriteRule ^ https://www.%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
    RewriteCond %{REQUEST_URI} !^.*/administrator/index\.php [NC]
    RewriteCond %{THE_REQUEST} ^[A-Z]{3,9}\ /(.*)index\.php($|\ |\?) [NC]
    RewriteRule ^ /%1 [R=301,L]
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteCond %{REQUEST_URI} (.+)/$
    RewriteRule ^ %1 [R=301,L]
    </IfModule>
    Voilà, j'accepte les commentaires !
    Merci.
    "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
    https://www.graphiquedesign-bf.com/

    Commentaire


    • #3
      Tiens, avec ce code dans le .htaccess, j'ai JComments qui ne fonctionne plus !
      Bizarre, bizarre, bizzzzarre !
      "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
      https://www.graphiquedesign-bf.com/

      Commentaire


      • #4
        Visiblement, pas trop de succès avec mon topic !
        Quand Google indexe vos pages, certaines avec un / en fin d'url et d'autres, sans / en fin d'url, ça ne vous fait rien ?
        "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
        https://www.graphiquedesign-bf.com/

        Commentaire


        • #5
          Question intéressante, et, première fois que je la vois, bien que j'ai déjà pu sorvoler de nombreux sujets.
          N'hésite pas à repasser compléter, si tu trouves plus d'informations.

          Commentaire


          • #6
            Envoyé par GraphiqueDesign Voir le message
            Visiblement, pas trop de succès avec mon topic !
            Quand Google indexe vos pages, certaines avec un / en fin d'url et d'autres, sans / en fin d'url, ça ne vous fait rien ?
            GraphiqueDesign.

            Je pense que Google sait comprendre le / dans les url comme étant un séparateur menant vers un chemin de répertoire du site sans l'assimiler à du duplicate content.

            De même qu'il sait que .com et .com/index.php sine une seule et même page. Je n'ai en tous cas pas de duplicate content signalé dans ma console alors que je n'ai pas de règle spécifiques en place à ce sujet.

            Bonne journée.
            crapouille63 likes this.
            Cordialement.
            __
            Eddy !!!
            Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

            Commentaire


            • #7
              C'est un site de vérification SEO qui me signalait cette erreur en la gratifiant d'une note affligeante ! Mais certainement qu'il dramatise un peu les choses, tout comme cet autre site qui signale très négativement la présence d'une paire de balise h1 dans une même page. Merci Eddy.
              "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
              https://www.graphiquedesign-bf.com/

              Commentaire


              • #8
                Pour le H1, je suis d'avis de n'en avoir qu'une par page, c'est LE titre de la page…
                Cordialement.
                __
                Eddy !!!
                Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                Commentaire


                • #9
                  Envoyé par Eddy.vh Voir le message
                  Pour le H1, je suis d'avis de n'en avoir qu'une par page, c'est LE titre de la page…
                  Et pourtant, Olivier Andrieux (Abondance) affirme qu'il n'y a aucune règle stricte sur le nombre de balises h1 !
                  Un autre site a fait un test et ohhhh surprise, la page avec 2 balise h1 est sortie vainqueur.

                  En fait, une autre source me dit que de s'en tenir qu'à une seule balise h1 est une idée qui date d'une autre époque. Il est vrai que nos habitudes, on y tient même quand le contexte a beaucoup changé. Il m'arrive régulièrement d'avoir à remettre en question certaines pratiques acquises ... autrefois.
                  "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                  https://www.graphiquedesign-bf.com/

                  Commentaire


                  • #10
                    Mais c'est parfait.

                    Je suis mon instinct et chacun doit faire de même. Si deux éléments dans une même page ont une même importance, pourquoi pas même si je reste dubitatif ?

                    Parce que d'importance il s'agit, sinon à quoi sert-il d'avoir 6 niveaux dans les titres.
                    Cordialement.
                    __
                    Eddy !!!
                    Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                    Commentaire


                    • #11
                      Je pense que utiliser une seule balise H1 peut trouver son sens, lorsque l'on utilise des lecteurs d'écran, pour les mal voyant et les aveugles.
                      Il est important de bien structurer sa page pour les lecteurs d'écran et les navigateurs texte.

                      Sinon, j'avais moi aussi par le passé, des cas ou j'avais plusieurs fois les balises H1 dans la page, et, effectivement, elle n'était pas pour autant déclassée. Le H1 est censé signaler que l'information est un titre de premier niveau, donc, une information importante, comme le dit Eddy, le titre de la page ou du tutoriel en règle générale. On peut penser que répéter la balise H1 pourrait être une méthode de seo pour optimiser son positionnement, ce n'est pas impossible, mais, ça ne répond pas aux standards conseillés.

                      Commentaire


                      • #12
                        Merci ZerooCool,
                        En fait, je ne trouve aucun site qui conseille clairement de s'en tenir à une seule balise h1 ! J'ai moi-même toujours appliqué cette "règle" jusqu'au jour où un développeur de chez Joomhaper m'a demandé pourquoi je faisais cela et quel standard du Web préconisait cela. Je suis parti voir chez Abondance qui pour moi est une référence en la matière et effectivement, il confirme qu'il n'existe aucune règle en la matière. Si dans une page, on a juste un article, il semble évident qu'une seule balise h1 sera présente (le titre de l'article). Mais sur une page produits par exemple, on peut très bien avoir 2 voire 3 axes de communication qui nécessiteront chacune une balise h1, elle même suivie de h2 et de h3.

                        En fait, le conseil le plus judicieux que j'ai trouvé, c'est d'affilier une balise h1 à ce qui est assez important pour en justifier l'usage.

                        On trouve à peu prêt une même discussion concernant l'ordre de placement des balises dans la page. La balise h1, doit elle forcément être, chronologiquement, la première balise en place dans la page ou une page, peut elle commencer avec une balise h2 puis arriver sur une balise h1 ?
                        "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                        https://www.graphiquedesign-bf.com/

                        Commentaire


                        • #13
                          Je ne souhaite pas discuter les propos de Abondance mais si je fais une rapide recherche sur la balise h1 sur monsieur Google (pour ne citer que lui), que je scrute les premiers résultats (yakaferci, webrankinfo, referenseo, etc.), je trouve quand-même sur chacun des articles l'importance de respecter les niveaux de titres et que le h1 ne devrait apparaître qu'une fois par page afin de bien cibler le titre de la page et son importance pour cette dernière.

                          Bref, de mon point de vue, je pense qu'il soit inutile d'avoir plus d'une H1 dans une page, chaque section pouvant recevoir un H2 et les sous-sections un H3, etc.
                          Cordialement.
                          __
                          Eddy !!!
                          Tutoriels BreezingForms en Français : https://www.breezingforms.eddy-vh.com/

                          Commentaire


                          • #14
                            Bahhh, le sujet est assez vaste pour que l'on puisse y confronter nos avis, paisiblement. Parce qu'en allant chez webrankinfo justement, j'y ai trouvé ce lien qui affirme clairement qu'en html5 : https://blog.lesieur.name/les-balise...sees-en-html5/
                            "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                            https://www.graphiquedesign-bf.com/

                            Commentaire


                            • #15
                              Bonjour à tous,

                              échange très intéressant :-)

                              # duplicate
                              Pour la partie nettoyage via .htaccess, je ne peux pas aider
                              Dans la pratique, j'ai fait l'impasse de xxx/ < vs > xxxx
                              Constat: ça n'empêche absolument pas le positionnement d'un de mes sites en 1ère page (secteur non concurrentiel et non pollué par l'influence d'achats de mots clés, je précise)

                              # balisage H1
                              Je conseille d'élargir de le point de vue, aux différents angles de caméra:

                              1 - W3C:
                              définit un ensemble de règles relevant à la fois de la technique et de la bonne pratique "à l'intention de l'utilisateur final"

                              2- GOOGLE:

                              Impose SES propres règles, en avançant l'argument "utilisateur final", POUR fagociter l'économie des éditeurs internet.
                              Particulièrement efficace en France où nous sommes devenus très Google dépendants.
                              Et le GAFA ne s'y est pas trompé car il développe les partenariats en tous sens avec des influenceurs économiques (Conseils régionaux, Instituions diverses et variées)

                              Même s'il ne respecte pas lui-même les règles qu'il nous impose.
                              Exemple type > met la pression sur les éditeurs pour le développement de versions mobiles de leurs sites. Mais ne sait pas "lire" une appli mobile ...

                              Néanmoins, comme les français sont google dépendants, il faut en passer par là.

                              La préconisation de Google est de n'avoir qu'un seul TAG H1 par page avec:
                              > ( [ tag h1 ] = Titre de la page) + ( cohérent avec le <title> ) + ( cohérent avec le contenu "métier")

                              Ex: une page avec un h1 + <title> qui disent "le grand duc à perruque orange" ne doit pas raconter l'histoire du "chat vert à pois rose")

                              3- L'utilisateur:

                              Un titre de page = le sujet qu'on va traiter.

                              Sous-titre, sous-sous-titre etc. et paragraphe: le traitement du sujet (présentation / hypothèse / argumentation / conclusion)
                              Bref, comme on faisait à l'école pour les épreuves de bac en français)

                              Google, au passage, appuie cette conception du contenu (argument utilisateur final >> on peut le suivre aussi)

                              Utilisateur: quoi de plus lassant que:
                              - d'avoir des pages hyper longues
                              - d'avoir des Titres à répétition (surtout si la charte css les colle en Big-Big size + couleurs pétentes)
                              - lire une page qui traite de plusieurs sujets > plusieurs sujets = 1 thèse, 1 roman, 1 dossier... pas 1 article

                              4- le joker HTML 5

                              L'arrivée de HTML 5 a développé la notion de zonage de contenu > Sections: <section>, <article>, <nav>, <aside>, <header>, <footer>
                              Pour la structuration du document et l'interopérabilité des navigateurs.
                              Mais pas que.
                              L'objectif étant aussi de distinguer le contenu à valeur ajoutée pour l'utilisateur (réponse pertinente à recherche d'information), du contenu fonctionnel (charte graphique, navigation, ...) et du contenu à moindre valeur ajoutée avec liens récurrents (à propos / mentions légales...)

                              Ce qui induit que tout le contenu placé dans ces zones n'a pas le même poids / valeur sémantique que le contenu "riche" d'une page: rédactionnel + medias + liens (pertinents les medias et les liens, on ne le dira jamais assez)

                              Google a dit > moins d'incidence des tags de titres et sous-titres dans les sections.
                              D'où (serait) moins grave de dupliquer du tag <h1>, à condition que ce soit dans ces sections
                              Sauf que:
                              - entre ce que Google dit, et ce que Google fait >> y a parfois un monde, voire un univers (ou plusieurs galaxies)
                              - les choses pourraient encore changer. Google aime beaucoup changer ses règles pour nous essoufler. Et le W3C penser à une nouvel objectif utilisateur plus intéressant, souvent à bon escient (cf HTML5)

                              Dans la pratique, la mise en application d'une logique simple et orientée utilisateur m'a toujours rendu service.
                              Et c'est montré "solide" du point de vue Google, comme pour mes petits nerfs >> un seul tag <h1>

                              Bonne journée :-)
                              Dernière édition par crapouille63 à 08/02/2019, 14h19

                              Commentaire

                              Annonce

                              Réduire
                              1 sur 2 < >

                              C'est [Réglé] et on n'en parle plus ?

                              A quoi ça sert ?
                              La mention [Réglé] permet aux visiteurs d'identifier rapidement les messages qui ont trouvé une solution.

                              Merci donc d'utiliser cette fonctionnalité afin de faciliter la navigation et la recherche d'informations de tous sur le forum.

                              Si vous deviez oublier de porter cette mention, nous nous permettrons de le faire à votre place... mais seulement une fois
                              Comment ajouter la mention [Réglé] à votre discussion ?
                              1 - Aller sur votre discussion et éditer votre premier message :


                              2 - Cliquer sur la liste déroulante Préfixe.

                              3 - Choisir le préfixe [Réglé].


                              4 - Et voilà… votre discussion est désormais identifiée comme réglée.

                              2 sur 2 < >

                              Assistance au forum - Outil de publication d'infos de votre site

                              Compatibilité: PHP 4.1,PHP4, 5, 6DEV MySQL 3.2 - 5.5 MySQLi from 4.1 ( @ >=PHP 4.4.9)

                              Support Version de Joomla! : | J!3.0 | J!2.5.xx | J!1.7.xx | J!1.6.xx | J1.5.xx | J!1.0.xx |

                              Version française (FR) D'autres versions sont disponibles depuis la version originale de FPA

                              UTILISER À VOS PROPRES RISQUES :
                              L'exactitude et l'exhaustivité de ce script ainsi que la documentation ne sont pas garanties et aucune responsabilité ne sera acceptée pour tout dommage, questions ou confusion provoquée par l'utilisation de ce script.

                              Problèmes connus :
                              FPA n'est actuellement pas compatible avec des sites Joomla qui ont eu leur fichier configuration.php déplacé en dehors du répertoire public_html.

                              Installation :

                              1. Téléchargez l'archive souhaitée : http://afuj.github.io/FPA/

                              Archive zip : https://github.com/AFUJ/FPA/zipball/master

                              2. Décompressez le fichier de package téléchargé sur votre propre ordinateur (à l'aide de WinZip ou d'un outil de décompression natif).

                              3. Lisez le fichier LISEZMOI inclus pour toutes les notes de versions spécifiques.

                              4. LIRE le fichier de documentation inclus pour obtenir des instructions d'utilisation détaillées.

                              5. Téléchargez le script fpa-fr.php à la racine de votre site Joomla!. C'est l'endroit que vous avez installé Joomla et ce n'est pas la racine principale de votre serveur. Voir les exemples ci-dessous.

                              6. Exécutez le script via votre navigateur en tapant: http:// www. votresite .com/ fpa-fr.php
                              et remplacer www. votresite .com par votre nom de domaine


                              Exemples:
                              Joomla! est installé dans votre répertoire web et vous avez installé la version française du fichier FPA:
                              Télécharger le script fpa-fr.php dans: /public_html/
                              Pour executer le script: http://www..com/fpa-fr.php

                              Joomla! est installé dans un sous-répertoire nommé "cms" et vous avez installé la version française du fichier FPA:
                              Télécharger le script fpa-fr.php dans: /public_html/cms/
                              Pour executer le script: http://www..com/cms/fpa-fr.php

                              En raison de la nature très sensible de l'information affichée par le script FPA, il doit être retiré immédiatement du serveur après son utilisation.

                              Pour supprimer le script de votre site, utilisez le lien de script de suppression fourni en haut de la page du script. Si le lien de suppression échoue pour supprimer le script, utilisez votre programme FTP pour le supprimer manuellement ou changer le nom une fois que le script a généré les données du site et le message publié sur le forum. Si le script est toujours présent sur le site, il peut être utilisé pour recueillir suffisamment d'informations pour pirater votre site. Le retrait du script empêche des étrangers de l'utiliser pour jeter un oeil à la façon dont votre site est structuré et de détecter les défauts qui peuvent être utilisé à vos dépends.
                              Voir plus
                              Voir moins

                              Partenaire de l'association

                              Réduire

                              Hébergeur Web PlanetHoster
                              Travaille ...
                              X