balise META description en double sur des URL de type '?start=10'

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [RÉGLÉ] balise META description en double sur des URL de type '?start=10'

    Bonjour,

    Si j'ai bien compris les quelques recherches que j'ai faites, le suffixe ?start=10 signifie : aller directement à la page 10.

    Dans les GWT, à la rubrique améliorations HTML, j'ai une liste de 25 balises META description en double.

    Souvent, le doublon porte sur quelque chose comme :
    url.html
    url.html?start=10

    La génération (par Joomla ? ou alors peut-être par FlexiContent, que j'utilise ?) de ces url est totalement inutile : je n'ai (presque) jamais 10 pages à l'intérieur d'une catégorie. Et je ne souhaite pas de toutes façons donner la possibilité de naviguer ainsi.

    Est-il possible de désactiver la génération de ces url ?

    Et sinon, comment éviter que Google voit en url.html?=start10 une sorte de doublon de l'url normale ?

    Merci d'avance.

    Florence
    Dernière édition par FlodAriege à 28/08/2015, 12h01 Raison: Réglé avec une consigne disallow dans le robots
    Flo, Ariège

    Il n'y a que celui qui a honte d'apprendre qui a peur de demander

  • #2
    Re : balise META description en double sur des URL de type '?start=10'

    J'ose faire un petit up.
    Et j'en rajoute une couche au passage (ouhla !!)

    Qu'est-ce qui provoque la génération d'URL du type :
    /co​mpo​nen​t/c​ont​ent​/ca​teg​ory​/10​0-alias-du-titre-de-l-article.​htm​l
    (100 étant selon toute probabilité le n° de la catégorie dans laquelle se trouve cet article).

    J'ai plein d'URL de ce type dans les GWT qui ont des balises en double (meta title ou meta description)
    Flo, Ariège

    Il n'y a que celui qui a honte d'apprendre qui a peur de demander

    Commentaire


    • #3
      Re : balise META description en double sur des URL de type '?start=10'

      Bonjour,

      Je me joins à ton UP car je me posais la même question il y a quelques jours.

      J'avais une première idée qui serait d'ajouter une balise canonical vers l'url épurée de ses START.
      Mais, ayant déjà d'autres trucs sur le feu, je ne suis pas allé plus loin

      Donc, si quelqu'un a une idée, vous savez que nous sommes au moins deux à nous poser ce genre de question en plein mois d'aout
      UP, le plugin universel à découvrir sur https//up.lomart.fr
      bgMax
      , AdminOrder, MetaData, Zoom, ArtPlug, Custom, Memo, Filter, ... sur http://lomart.fr/extensions

      Commentaire


      • #4
        Re : balise META description en double sur des URL de type '?start=10'

        Salut,

        Cela m'arrive aussi et je ne comprends pas non plus trop comment Google réussit à choper des catégories, des articles, des tags et des modules qui ne sont censé être appelé nulle part...
        Je trouve cela un peu intrusif


        Bref personnellement je fait dans Outil Webmaster:
        Index Google / URL à supprimer et le problème disparait au bout de quelque jour ...

        C'est un peu laborieux et je suppose qu'un webmaster malin aurait une astuce plus élaborée mais çà a le mérite de fonctionner.

        Commentaire


        • #5
          Re : balise META description en double sur des URL de type '?start=10'

          Merci pour l'astuce, que je me suis empressée de mettre en œuvre. Je tâcherai de penser à revenir ici dire ce que ça aura donné dans quelques jours et aussi à plus long terme (je crains que ces URL ne finissent par revenir).
          Flo, Ariège

          Il n'y a que celui qui a honte d'apprendre qui a peur de demander

          Commentaire


          • #6
            Re : balise META description en double sur des URL de type '?start=10'

            D'autres reviennent, c'est un véritable enfer car je ne comprennent toujours pas d'où çà sort.
            En attendant je fais çà à la main mais j'ai vraiment l'impression de faire un boulot de souillons...

            Si quelqu'un à une explication, je prends aussi.

            Commentaire


            • #7
              Re : balise META description en double sur des URL de type '?start=10'

              Envoyé par FlodAriege Voir le message
              Dans les GWT, à la rubrique améliorations HTML, j'ai une liste de 25 balises META description en double.

              Souvent, le doublon porte sur quelque chose comme :
              url.html
              url.html?start=10

              [...]

              Est-il possible de désactiver la génération de ces url ?
              La balise meta <description> joue un rôle secondaire, et même n'a aucun poids dans le positionnement des pages d'un site internet. Donc qu'elle soit en double ne devrait pas impacter le référencement.
              Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

              Commentaire


              • #8
                Re : balise META description en double sur des URL de type '?start=10'

                D'accord, merci.
                Mais j'ai aussi des balises TITLE en double à vues de ces paginations.

                De toutes façons à force de tâtonnements (et en m'appuyant largement sur la logique des solutions que tu m'avais déjà données pour des cas de figures un peu comparables), j'ai réussi à interdire leur indexation dans mon robots avec la consigne suivante :

                Disallow: /*.html?start=*

                Puis j'ai demandé la suppression des URL déjà indexées.

                On verra bien si ça résiste au temps.
                Dernière édition par FlodAriege à 28/08/2015, 12h00
                Flo, Ariège

                Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                Commentaire


                • #9
                  Re : balise META description en double sur des URL de type '?start=10'

                  url.html
                  url.html?start=10
                  la seconde url indique que tu utilise des sauts de pages.
                  Chaque lien ayant une url comme la seconde a été visité par google et google le vois comme un article a part entiere (recherchee de mots clefs + réf).

                  Les meta sont identiques sur les deux liens car il pointent vers la meme ressource.

                  Une analogie est que ton article serait un livre que tu commences a lire a la page 1 en suivant la premiere url et a la page 10 si tu suit la seconde.

                  Interdire l'indexation de ces liens occulte une grosse partie de ton document des résultats de recherche.

                  Si tu as bien concu ton article, chaque section entre saut de page st un regroupement d'idées ayant trait au meme sujet, donc il doit etre indéxé via google....
                  Dernière édition par lefabdu51 à 25/09/2015, 07h26

                  Commentaire


                  • #10
                    Re : balise META description en double sur des URL de type '?start=10'

                    Bonjour,

                    C'est bien que tu me parles de ça maintenant.

                    Au moment où j'ai écrit ce post, il ne s'agissait pas de pagination due à des sauts de page : c'était mes blogs de catégorie. Avec peu d'intérêt que ça soit indexé.

                    Mais depuis, j'ai installé une extension compatible avec FlexiContent pour gérer les sauts de page dans mes articles les plus longs (pagebreakmyjspace).

                    J'ai en effet bien envie d'utiliser davantage les sauts de page, notamment pour réduire mon taux de rebond (c'est un peu artificiel, mais bon).

                    Cette extension génère des meta next et previous, gère bien les canonical. Elle semble permettre d'éviter le duplicate. Et de toutes façons le contenu de chaque page est bel et bien unique.

                    Du coup, ton post tombe à pic pour me rappeler que je dois modifier la règle dans mon robots :
                    Les start10, start20, etc. = blog de catégorie = ne pas indexer
                    Les autres (start2, start3, etc. ) = sauts de page = indexer
                    (Aucun de mes articles n'a 10 pages)

                    Merci.
                    Bonne journée.

                    Flo

                    Edit :
                    Dans mon robots.txt, j'ai donc remplacé :
                    Disallow: /*.html?start=*

                    par :
                    Disallow: /*.html?start=10
                    Disallow: /*.html?start=20

                    ce qui laisse la possibilité à Googlebot d'indexer les pages d'un article paginé, mais ne l'autorise pas à indexer les 2ème et 3ème pages de mes blogs de catégorie (10 articles par page).

                    Merci encore, car j'avais complètement zappé ce détail, et au fur et à mesure que j'aurais mis en place des paginations sur mes longs articles, j'aurais perdu en indexation & référencement...
                    Dernière édition par FlodAriege à 25/09/2015, 16h57
                    Flo, Ariège

                    Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                    Commentaire


                    • #11
                      Re : balise META description en double sur des URL de type '?start=10'

                      Bonjour
                      Perso pour les url non souhaitées et/ou en duplicate j'ai rajouté ca dans mon fichier logic.php qui est appelé dans le index.php :

                      Code PHP:

                      if (preg_match("#users|error|Itemid|keyword|limitstart|orderby|contact|legales|conditions|limit|DESC|Desc|notify|feed|index.php|undefined|tmpl|PageSpeed|productsublayout#",$_SERVER['REQUEST_URI'])){$document->setMetaData'robots''noindex, follow' );} 
                      Dans le dictionnaire on peut rajouter ce que l'on veut, component, content, start=10, start=20, etc, etc séparé de | (ou)

                      Le jus seo est quand même transmis à la page canonique en cas de backlink car en follow et le crawl de la page peut se faire pour voir la balise canonical. Noindex on donne un ordre, c'est clair.

                      Peut être possible d'en faire un plugin tout bête où en admin on peut insérer les termes à exclure récupérés dans des variables ?

                      Commentaire


                      • #12
                        Re : balise META description en double sur des URL de type '?start=10'

                        Bonjour,

                        Je complète la réponse à ce fil.
                        Je viens de découvrir un petit plugin qui rajoute la page de départ à la balise title

                        Il est suffisamment simple pour pouvoir adapter le texte à afficher.
                        UP, le plugin universel à découvrir sur https//up.lomart.fr
                        bgMax
                        , AdminOrder, MetaData, Zoom, ArtPlug, Custom, Memo, Filter, ... sur http://lomart.fr/extensions

                        Commentaire


                        • #13
                          Re : balise META description en double sur des URL de type '?start=10'

                          Envoyé par FlodAriege Voir le message

                          Du coup, ton post tombe à pic pour me rappeler que je dois modifier la règle dans mon robots :
                          Les start10, start20, etc. = blog de catégorie = ne pas indexer NON = BLOQUER = Pas de crawl = Pas de jus seo en cas de backlink
                          Les autres (start2, start3, etc. ) = sauts de page = indexer NON = NE PAS BLOQUER = Autoriser le crawl
                          Envoyé par FlodAriege Voir le message

                          Dans mon robots.txt, j'ai donc remplacé :
                          Disallow: /*.html?start=*

                          par :
                          Disallow: /*.html?start=10
                          Disallow: /*.html?start=20
                          Code:
                          NOINDEX: /*.html?start=10
                          NOINDEX: /*.html?start=20
                          Est plus approprié = un ordre = ne pas indexer, crawler, jus seo transmis à la page canonique.

                          Et encore mieux dans le code source (car NOINDEX dans robots.txt non officiellement reconnu mais fonctionne)

                          Code:
                          <meta name="robots" content="noindex, follow" />

                          Commentaire


                          • #14
                            Re : balise META description en double sur des URL de type '?start=10'

                            OUla ! Moi avoir pas tout compris, là !
                            Tony, si tu es encore par là, tu peux me redire ça STP ?
                            Flo, Ariège

                            Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                            Commentaire


                            • #15
                              Re : balise META description en double sur des URL de type '?start=10'



                              Comme j'avais reçu la notification de message lorsque Lomart à répondu, par curiosité j'ai relu le post et je me suis aperçu de ce que tu avais écris...

                              En fait, quand tu écris disallow dans ton robots.txt, ca ne veux pas dire "n'indexes pas", ca veux dire "t'as pas le droit de crawler cet endroit". Le problème c'est que des url bloquées via robots.txt peuvent être indexées, par exemple quand le robot y avait accès avant que tu donnes l'indication.

                              Tu peux donc voir ces url quand tu tapes la commande : site:mondomaine.com dans google, que tu va à la dernière page, page 33 pour ton site, et que tu cliques sur "relancer la recherche pour inclure les résultats omis", tu retournes à la page 32, et en fait là tu peux voir toutes les url bloquées, mais quand même indexées "La description de ce résultat n'est pas accessible à cause du fichier robots.txt de ce site. En savoir plus"

                              Le bloquage via robots.txt n'est pas la réponse au duplicate content, surtout si le bot a déjà crawlé et indexé ces pages.

                              Une balise noindex, follow + balise canonique sur toutes les pages en duplicate oui, + rel=prev et rel=next sur le contenu paginé (mais la balise canonique ne doit pas indiquer la page 1 sur la page 4 par exemple, elle doit indiquer la page 4)



                              A mon sens, la "bonne" méthode est d'appliquer une balise noindex, follow sur ces pages, ne pas les bloquer pour que les bots puissent les crawler et voir la balise canonical.
                              Tu peux accélérer la chose dans GWT avec "explorer comme google", lui demander de crawler la page, il verra la balise noindex et la canonique.

                              Si c'est une url "normale", c'est à dire accessible sur ton site via pagination, via affichage blog, flux rss, etc...il faut laisser comme ca et ne pas la bloquer, avec la balise noindex elle ne sera pas indexée, et avec la canonique, en cas de backlink pointant vers cette page, le jus seo sera transmis à la page canonique, chose qui n'est pas possible si cette url est bloquée via robots.txt.

                              Si c'est une url normalement non accessible via ton site, il faut faire comme ci dessus, puis si et seulement si tu es sure que googlebot a bien desindexé ta page, remettre l'instruction dans le robots.txt.

                              Le fichier robots.txt permet de gérer le trafic du robot d'exploration. Pour découvrir ce en quoi ce fichier consiste et comment l'utiliser, consultez ce guide d'introduction.


                              Une balise noindex peut empêcher Google d'indexer une page afin qu'elle ne s'affiche pas dans les résultats de recherche. Découvrez dans ce guide comment mettre en œuvre des balises noindex.



                              PS : compares tes url canoniques avec les urls et les urls bloquées de ton robots.txt, y'a comme un blème

                              inurl:start site:mondomaine.fr
                              Dernière édition par -Tony- à 26/10/2015, 15h59

                              Commentaire

                              Annonce

                              Réduire
                              Aucune annonce pour le moment.

                              Partenaire de l'association

                              Réduire

                              Hébergeur Web PlanetHoster
                              Travaille ...
                              X