url étranges

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • url étranges

    Bonjour,

    Je viens de découvrir que Google a indexé des urls qui ne devraient pas exister sur mon site.
    Normalement j'ai une page d'accueil et ensuite des pages auxquelles on accède par le menu principal donc les url sont sous ce format :
    /fr/
    /fr/menu1.html
    /fr/menu2.html
    /fr/menu2/sous-menu1.html
    etc.

    mais voilà les url que je viens de découvrir en plus des autres :

    /fr/?view=category&id=40
    /fr/?view=category&id=15
    etc.

    ma page d'accueil n'a pas d'article affiché dans le main-content car ce sont uniquement des modules sur cette page dont le type d'affichage est de type "blog des articles en vedette" avec une catégorie dans laquelle aucun article n'est en vedette)
    mais avec ces url j'ai ma page d'accueil avec en position main-content les articles de la catégorie dont l'id est 40 ou 15 etc.

    alors que ces articles ne devraient pas apparaitre ici du tout mais dans la page dédiée via le menu.

    Je n'y comprends rien, j'ai régulièrement des nouvelles url qui apparaissent dans ma console Google search.

    Est-ce que vous pouvez m'aider à régler ce problème svp ?

  • #2
    Salut,

    Si Google a trouvé ces adresses c'est qu'elles existent ou ont existé quelque part sur ton site.
    Ta configuration générale, celle de tes menus, d'un module ou d'un article est surement en cause.
    Peut-être un composant/plugin pour ton sitemap ?

    Une url permettrait de regarder ton code de près et de ne pas parler dans le vide...

    Dol.
    Je préfère éclairer que briller.” - “J'ai peut-être l'air froid, mais je suis pas givré.- "ça dépend ça dépasse"
    Ne m'envoyez pas de message privé pour résoudre vos problèmes sans y avoir été invité.
    Dolmenhir : tailleur de site web depuis 1997. Spécialiste Joomla depuis 2005. https://www.dolmenhir.fr

    Commentaire


    • #3
      Envoyé par dolmenhir Voir le message

      Une url permettrait de regarder ton code de près et de ne pas parler dans le vide...

      Dol.
      Bonjour,

      Merci de prendre le temps de me répondre

      l'url du site : www.horizontalsoftware.com

      Je n'ai pas créé le site à la base, et à sa sortie la réécriture n'avait pas été activée. Le site utilisait Seblod et presque tout le contenu est affiché via des modules. Quand j'ai pris le relai, j'ai activé la réécriture au vol, j'ai supprimé Seblod car je n'y comprenais rien, il avait été principalement installé pour gérer nos formulaires de contact... ce qui n'est pas son but premier. J'ai supprimé des pages et recréé des nouvelles. Dernièrement on a fermé nos pages blog qui étaient gérées sur ce site pour ouvrir un autre blog géré sous worpdress (notre société a deux sites web, celui-ci et un dédié à un produit plus spécifique et chaque site avait son propre blog, nous avons donc mis en commun les blogs et allons développé un site commun dans l'année, en attendant j'essaie de corriger le plus de problèmes possibles liés aux anciennes url référencées).
      Ce qui m'étonne ce sont ces nouvelles url que je n'avais pas avant, il en sort régulièrement mais initialement c'était des url non réécrites normales : www.monsite.com/menu/?view=article&id=10
      par exemple ou bien ajout de la catégorie dans l'url mais rien ne s'affichait directement sur la page d'accueil. J'avais eu le problème il y a peu de temps avec des articles que j'ai déplacés du blog vers la page clients avant de fermer le blog. Ces articles se sont retrouvés indexés avec une url directe (www.monsite.com/id-alias-article) et impossible pour moi de trouver une règle valable de réécriture dans mon htaccess (je ne suis pas assez habituée aux regex).

      Comment voir si ces problèmes sont liés à une extension ? Qu'est-ce que je dois regarder exactement ?

      Merci

      Commentaire


      • #4
        Je ne trouve pas trace de ces urls (?view=category&id=) sur les pages du site.
        Pas plus que chez Google quand je lui demande de me sortir les pages qu'il a indexées pour ce domaine.

        Tu devrais regarder dans le composant "Redirection" (et l'activer si besoin) pour identifier la provenance de ces urls.
        Tu peux t'en servir aussi pour mettre en place des redirections permanentes le temps de purger ces urls indésirables.
        Maintenant, si ces urls sont le fait de "backlinks", il faudra démarcher chacun des sites concernés pour leur demander de les supprimer ou de les mettre à jour.

        A noter quelques anomalies sur plusieurs pages : h1 absent, url canonique non définie, attribut alt d'image manquant...

        Dol.
        Je préfère éclairer que briller.” - “J'ai peut-être l'air froid, mais je suis pas givré.- "ça dépend ça dépasse"
        Ne m'envoyez pas de message privé pour résoudre vos problèmes sans y avoir été invité.
        Dolmenhir : tailleur de site web depuis 1997. Spécialiste Joomla depuis 2005. https://www.dolmenhir.fr

        Commentaire


        • #5
          Envoyé par dolmenhir Voir le message
          Je ne trouve pas trace de ces urls (?view=category&id=) sur les pages du site.
          Pas plus que chez Google quand je lui demande de me sortir les pages qu'il a indexées pour ce domaine.
          Dans la Google Search Console, à quoi correspond la partie "couverture > Indexée, mais non envoyée via un sitemap" car il m'indique 352 pages concernées et c'est là que je trouve ces urls.
          Exemple, là il m'affiche ces urls en indexées mais non envoyées via un sitemap (pour certaines une redirection a déjà été faite via le composant joomla que j'utilise déjà oui mais qui ne propose que les url n'existant plus alors que le problème dont je parle dans ce post correspond à des url qui existent vu qu'une page s'affiche bien) :
          - https://www.horizontalsoftware.com/f...entalents.html (cette url avec l'id de l'article n'existait plus depuis que j'avais activé la réécriture)
          - https://www.horizontalsoftware.com/f...set&Itemid=514 (impossible de bloquer cette url, j'ai rajouté un code dans le fichier php pour avoir une meta robot=noindex mais c'est du bricolage...)
          - https://www.horizontalsoftware.com/f...category&id=40 (voilà le type d'url dont je parlais dans ce post, j'ai également fait du bricolage, comme c'était une catégorie du blog qui a fermé, j'ai supprimé les articles et ajouter la meta robot noindex dans la catégorie mais je préfèrerais réussir à rediriger ces url vers le nouveau blog au niveau de la catégorie correspondante)
          etc...

          est-ce que je ne dois pas m'occuper de ces url indiquées dans la google search console ?

          Tu devrais regarder dans le composant "Redirection" (et l'activer si besoin) pour identifier la provenance de ces urls.
          Tu peux t'en servir aussi pour mettre en place des redirections permanentes le temps de purger ces urls indésirables.
          Oui il est déjà activé mais les url étant pour la plupart existantes il ne me les affiche pas. Comment je pourrais les rediriger dans ce cas à part via le htaccess (mais je ne trouve pas la bonne regex...)

          A noter quelques anomalies sur plusieurs pages : h1 absent, url canonique non définie, attribut alt d'image manquant...
          Pour la partie url canonique non définie : je fais ça où et comment ?

          J'espère être claire, désolée si ce n'est pas le cas.

          Commentaire


          • #6
            Les urls dans la search console peuvent être là depuis un moment, depuis l'époque où il n'y avait pas de réécriture d'url active. Et le bot, qui les connait, fait "joujou" avec, mais se voit redirigé par celles qui ont une redirection en place.

            Elle peuvent provenir d'une page avec une brèche qui a permis au bot de parcourir toutes les urls de même type (?category par exemple).

            Pour tracer une url indésirable mais dont la redirection est en place via le composant, le + simple est de supprimer cette redirection, puis de la vérifier quand elle fera sa réapparition.
            Il sera alors possible d'identifier la page de référence.

            L'important est que ces urls soient correctement redirigées, soit via une redirection 301 (moved permanently) ou carrément un 410 (gone) qui obligera la désindexation de la page puisqu'elle est déclarée être supprimée.

            Mais pour l'heure, je n'en voit aucune dans les SERP de Google, donc, à priori, il n'y a aucune raison de s'en soucier.

            Pour l'url canonique, il y a un plugin natif pour cela : "Système - SEF"

            Dol.
            linceb aime ceci.
            Je préfère éclairer que briller.” - “J'ai peut-être l'air froid, mais je suis pas givré.- "ça dépend ça dépasse"
            Ne m'envoyez pas de message privé pour résoudre vos problèmes sans y avoir été invité.
            Dolmenhir : tailleur de site web depuis 1997. Spécialiste Joomla depuis 2005. https://www.dolmenhir.fr

            Commentaire


            • #7
              OK merci pour toutes ces infos. Je vais regarder le plugin pour les url canoniques.

              Bonne journée.

              Commentaire


              • #8
                Du coup, est-ce que quelqu'un saurait m'expliquer quelle regex utiliser pour une réécriture de ce type d'url ?
                Le composant joomla ne faisant pas de redirection pour les url accessibles, ce serait bien quand même de pouvoir réécrire et rediriger ces url.

                J'avais tenté ça :
                Code HTML:
                RewriteRule ^fr/\?view=category&id=40$ "https://www.horizontalsoftware.com/fr/support.html" [R=301,L]
                Mais ça ne fonctionne pas. Je ne sais pas ce que je dois écrire exactement pour que l'url soit réécrite et rediriger.

                Merci

                Commentaire


                • #9
                  Au fil du temps, Google indexe les pages d'un site (à moins que le site ne contienne que quelques pages, il ne le fait jamais en une fois). Quand une page est supprimée par le propriétaire du site, elle produira une erreur 404 s'il y a encore un lien vers elle quelque part dans le site (par exemple dans un article) ou un code 301 si elle est redirigée de façon permanente vers une autre.
                  Si elle est déjà indexée, mais retirée du site et du sitemap, elle sera notée comme "indexée, mais non envoyée par un sitemap" et il ne se passera rien de plus. Elle ne se retirera pas toute seule de l'index.
                  Si ces pages n'ont pas été remplacées par un contenu similaire, sur le même site ou sur un autre, le mieux est de les retirer de l'index de Google, via la Search Console.
                  Si par contre leur contenu se trouve ailleurs, il serait dommage de perdre cet indexation (et surtout les backlinks éventuels), aussi il conviendra de faire une redirection 301. Attention, ce n'est que si le contenu est vraiment similaire, sinon vous faites pire que bien.
                  Différentes extensions permettent de faire facilement ces redirections, comme sh404SEF qui permet même des redirections vers d'autres sites (ce que le composant de J! ne permet pas).
                  Tous les services pour les sites Joomla! : sécurité, nettoyage de sites piratés, hébergement, SEO, applications Fabrik, migration, compatibilité mobiles, accessibilité, ...
                  Administrateur certifié Joomla! 3
                  https://www.betterweb.fr

                  Commentaire


                  • #10
                    Envoyé par linceb Voir le message
                    Code HTML:
                    RewriteRule ^fr/\?view=category&id=40$ "https://www.horizontalsoftware.com/fr/support.html" [R=301,L]
                    Mais ça ne fonctionne pas. Je ne sais pas ce que je dois écrire exactement pour que l'url soit réécrite et rediriger.

                    Merci
                    Essayes plutôt sans les guillemets, et de manière globale sans valeur à id pour que tous les id soient concernés
                    Code HTML:
                    RewriteRule ^fr/\?view=category&id=[0-9]$ https://www.horizontalsoftware.com/fr/support.html [R=301,L]
                    Je préfère éclairer que briller.” - “J'ai peut-être l'air froid, mais je suis pas givré.- "ça dépend ça dépasse"
                    Ne m'envoyez pas de message privé pour résoudre vos problèmes sans y avoir été invité.
                    Dolmenhir : tailleur de site web depuis 1997. Spécialiste Joomla depuis 2005. https://www.dolmenhir.fr

                    Commentaire


                    • #11
                      Envoyé par dolmenhir Voir le message

                      Essayes plutôt sans les guillemets, et de manière globale sans valeur à id pour que tous les id soient concernés
                      Code HTML:
                      RewriteRule ^fr/\?view=category&id=[0-9]$ https://www.horizontalsoftware.com/fr/support.html [R=301,L]
                      Bonjour,
                      Je reprends le fil car j'avais dû mettre le sujet de côté ces derniers jours. J'ai testé cette solution mais ça ne fonctionne pas (j'ai testé mais pour une valeur d'id car toutes les id ne sont pas concernées et cette page de redirection correspond à l'id spécifique). Aucune redirection, la page reste affichée avec l'url initiale. Je ne comprends pas du tout ce qui se passe avec ces urls...

                      Commentaire

                      Annonce

                      Réduire
                      Aucune annonce pour le moment.

                      Partenaire de l'association

                      Réduire

                      Hébergeur Web PlanetHoster
                      Travaille ...
                      X