URL étrange et cause de doublon

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • URL étrange et cause de doublon

    Bonjour à tous,

    En me promenant sur Google, je découvrir une étrange URL MONDOMAINE.com/team/82-yoga-muenchen/108-yoga-muenchen-maxvorstadt reprenant à l'identique une page existante qui est MONDOMAINE.com/yoga-leipzig

    Cela fait donc du duplicate content...

    La solution serait de mettre la page réelle MONDOMAINE.com/yoga-leipzig en URL canonicale (ou redirection), n'est-ce pas ?
    Mais en natif, Joomla ne propose pas cela me semble-t-il (rien vu dans la page article me permettant de le faire).

    Je dois sans doute aussi pouvoir demander à Google de supprimer cette page doublon.

    Mais, j'aimerai bien comprendre cette création farfelue, car il y a d'autres URL étranges...
    Comme :
    • MONDOMAINE.com/workshops?filter_from=2023-06-21&filter_category=1
    • MONDOMAINE.com/79-uncategorised
    • MONDOMAINE.com/component/users/​
    ​Une idée SVP ?
    Dernière édition par Joopas à 13/07/2023, 13h13

  • #2
    Bonsoir,

    Simplement, les page spécifiques comme la page de connexion ou de réinitialisation de mot de passe existent par défaut.
    Ce sont les urls que tu indique comme une création farfelue car elles ne sont pas réécrites.

    En effet, il manque tout simplement un ItemID, c'est à dire l'identifiant (ID) du lien de menu. Donc prends l'habitude, une fois que la réécriture est active (htaccess.txt en .htaccess et oui dans la configuration générale), de créer un menu caché (c'est à dire un menu que tu nomme menu caché car il ne sera pas affiché). Ce menu caché pourra servir à créer ces liens de ces pages afin de résoudre le problème de réécriture.

    Pour créer un lien de menu, il suffit d'indiquer le menu (donc celui que l'on a nommé menu caché), puis nouveau et choisir "utilisateur" > "formulaire de connexion". Reproduit cela pour le rappel de mot de passe en choisissant utilisateurs > "rappel de l'identifiant"... etc. Je te rassure, même les "pro" font aussi ces erreurs par manque de connaissance ou oublis.

    A propos du duplicate content, afin de donner plus de poids à une page donc de favoriser une url, tu peux utiliser une extension tierce. Par exemple, nous avons la version gratuite de route66 ( https://extensions.joomla.org/extension/route-66/ ). Il me semble que 4seo intègre également les balises canonical mais c'est à vérifier.​
    Joomla User Group (JUG) Lille : https://www.facebook.com/groups/JUGLille/

    Commentaire


    • #3
      Bonjour Daneel,

      Merci beaucoup pour ton feedback et pour cette idée de menu caché que je découvre ici.

      Cela me semble être une bonne idée pour les pages par défaut, comme component/users/​, (qu'on pourrait aussi mettre en noindex, non ?) mais pas pour les autres pages (les vraies farfelues ) qui sont créées non par défaut mais d'une manière indéterminée (enfin, j'ai rien fait consciemment pour qu'elles existent), à l'image du premier exemple donné (URL créée avec à la fin team/82-yoga-muenchen/108-yoga-muenchen-maxvorstadt au lieu de juste yoga-leipzig​ sur la page originale créée dans le menu).

      Là, la seule solution est d'ajouter une extension avec balise canonical ? Tu n'as pas d'idée de la manière dont ces pages peuvent être créées ?
      Dernière édition par Joopas à 07/07/2023, 07h22

      Commentaire


      • #4
        ah, c'est en réalité des scripts qui détournent les urls générés par l'ancien routeur à cause d'un problème connu.
        Pour faire simple, il y a une page externe au site qui est prise en compte par google avec faux liens.
        Comme ces liens fonctionnent et ne tombent pas sur une erreur 404, Google les prends en compte dans le référencement.

        Dans l'ancien routeur de Joomla 3 (par défaut), il y a des identifiant (ID) pour retrouver l'article ou catégorie comme par exemple le numero 82 mais tu peux écrire n'importe quoi derrière ce chiffre, on tombe systématiquement sur la même page. Tu retrouve l'id des articles dans la liste des articles en backend.

        Avec le "routeur moderne", l'url est généré sans cet identifiant et uniquement avec les alias. Le routeur moderne n'est pas activé par défaut sous J3 car tes urls seront modifiés et cela aura un impact sur le référencement qui devraient se corriger avec le temps. L'activation du nouveau routeur se fait via les paramètres des articles, dans l'onglet intégration.



        A savoir que le routeur moderne est désormais par défaut sous Joomla 4.

        Pour ma part, j'avais trouvé une solution :

        mais l'auteur a préféré abandonner son développement et le code n'est plus disponible.
        Ce qui est normal car cela ne concerne que les sites qui n'ont pas modifié nativement la gestion de leurs urls sous j3
        Tu peux toujours consulter la page pour t'informer sur ce problème.

        De mon avis, Le passage au routeur moderne est à envisager car cela évitera que ton référencement soit dilué ou pollué par ces fausses urls.
        Mais il faut savoir que Joomla 3 n'aura plus de version de sécurité à partir du mois d'aout de cette année donc dans un mois !
        Il est dans ton intérêt de migrer sur Joomla 4 afin d'avoir un meilleur seo, globalement un meilleur site ( plus performant, sécurisé, accessible, etc.).





        Dernière édition par daneel à 07/07/2023, 07h41
        Joomla User Group (JUG) Lille : https://www.facebook.com/groups/JUGLille/

        Commentaire


        • #5
          Ah super ! Maintenant je comprends pourquoi il y a ces URL là... et aussi comment les supprimer !

          Quand tu dis qu'en activant le routeur moderne cela va changer les URL, seulement celles créées par l'ancien routeur, n'est-ce pas ? Car les URL "propres" sont toutes avec allias (réécriture d'URL), donc logiquement rien ne bouge pour elles.

          Je compte passer à Joomla 4 cet été de toute manière, ce qui visiblement va remettre les pendules à l'heure à ce niveau-là, mais je voudrais savoir si je vais perdre du référencement quand même...

          Commentaire


          • #6
            Envoyé par Joopas Voir le message
            je voudrais savoir si je vais perdre du référencement quand même...
            Je pense que tu peux gagner en référencement en activant le routeur moderne sous J3 mais il faut agir avec stratégie notamment sur les redirections et voir si tu as le temps.
            De cette façon, ce sera plus une chose en moins à gérer pour la migration vers J4.

            Pour info, la documentation officielle (datant de la sortie du routeur moderne) : https://docs.joomla.org/J3.x:New_Routing_System/fr

            Voici une explication un peu plus détaillée :

            Comment se préparer pour passer au routeur moderne... ...et bénéficier directement des nouvelles URL mieux classées pour les articles de votre site web ?

            Ne pas préparer votre site risque certainement de compromettre le classement de votre site en termes de référencement (SEO) / optimisation des médias sociaux à cause des raisons suivantes :
            • URLs cassées (erreur 404 : page non trouvée)
            • Nouvelles URLs pour le même contenu indexé (contenu en double)
            • Les nouvelles URLs commencent avec un score de page zéro car il s'agit d'une nouvelle page pour le moteur de recherche
            • Les "backlinks" vers vos articles sont cassés, pointant vers une URL inexistante (erreur 404 : page non trouvée). Cela empêchera l'ajout de "jus de référencement SEO" à vos pages web (le jus de référencement est lorsque votre page web gagne en classement parce qu'elle est liée à partir d'un autre site web).
            • Les pages partagées sur les réseaux sociaux (comme Twitter, Facebook, Linkedin, etc.) sont cassées, pointant vers des URLs inexistantes (erreur 404 : page non trouvée).
            ​Il y a 3 étapes que vous devez suivre avant de pouvoir passer en toute sécurité au routeur moderne (avec la suppression des IDs) :
            1. Réparez vos articles orphelins (et retirez-les de l'index des moteurs de recherche donc de google search console, bing webmaster tools, etc.).
            2. Configurez des redirections pour chaque ancienne URL vers la nouvelle URL. (composant de redirection ou dans le htaccess)
            3. Effectuez des tests encore et encore...

            En effectuant correctement ces 3 étapes de préparation :
            • Les moteurs de recherche remplaceront l'ancienne URL par la nouvelle URL (redirection 301), transférant (ou conservant) le classement des pages accumulé pour ces pages vers la nouvelle URL.
            • Les liens arrière vers votre site continueront de fonctionner et de transférer du "jus de référencement SEO" à vos pages web.
            • Les pages partagées continueront de fonctionner car les anciennes URLs sont redirigées vers les nouvelles URLs.
            C'est beaucoup de travail... Cela peut l'être, surtout lorsque vous avez beaucoup d'articles ou que vous gérez un site multilingue. Dans ce cas, vous devez non seulement créer une redirection pour chaque page, mais aussi pour chaque page dans la langue dans laquelle elle peut être affichée !​ Bref, je ne sais pas combien de temps pour les redirections mais on peut essayer de limiter en utilisant les regex (les expressions régulières) et/ou des extensions tierces ( route66, sh404 )

            Pour ma part, je pense que le mal est déjà fait avec les fausses url donc je passerai en routeur moderne et je ferai des redirections si nécessaires sur les pages principales, le reste étant fait au fur et à mesure et je laisserai le temps pour le reste. C'est un choix pour repartir de façon un peu plus propre. Mais ce n'est qu'un avis personnel et comme je l'ai indiqué, les extensions tierces peuvent certainement vous aider.



            Joomla User Group (JUG) Lille : https://www.facebook.com/groups/JUGLille/

            Commentaire


            • #7
              Merci encore pour ce long partage qui va à mon avis en aider plus d'un...

              Je pense que tu as raison, c'est-à-dire que cela va aider en référencement, parce que les URL farfelues vont passer en 404, ce qui va indiquer aux moteurs de recherche qu'il n'est plus nécessaire de référencer ces pages-doublons.

              Niveau référencement, le risque me semble minimum, car toutes mes URL en accès libre sont cleans, c'est-à-dire sans numéro d'article ou de catégorie, etc. Sauf, celles qui sont dans la partie non accessible au public, donc pas référencées. Là, il y aura sans doute quelques liens morts à retrouver et à corriger.

              Mais, au cas où cela part en vrille, on peut faire marche arrière, n'est-ce pas ? Enfin, si l'URL menant au back office reste bien active bien sûr :-)​

              Commentaire


              • #8
                Envoyé par Joopas Voir le message
                Mais, au cas où cela part en vrille, on peut faire marche arrière, n'est-ce pas ?
                Enfin, si l'URL menant au back office reste bien active bien sûr :-)
                oui, c'est juste un paramètre. N'hésite pas à nous faire un retour quand tu auras avancé sur ce sujet,
                également sur la mise à jour vers Joomla 4 cet été.

                Bon week-end !

                Joomla User Group (JUG) Lille : https://www.facebook.com/groups/JUGLille/

                Commentaire


                • #9
                  Je viens de tester rapidement et cela met bien la page URL farfelue en 404 :-)

                  Pour les autres, celles qui sont en non accès public, cela donne des URL également étranges avec à la fin ?view=article&id=175rasarita-padottanasana&catid=87

                  Bon, je suis repassé en mode "héritage" et je vais voir cela à tête reposée la semaine prochaine ;-)

                  Merci encore et bon week-end à toi également !
                  Dernière édition par Joopas à 09/07/2023, 07h53

                  Commentaire


                  • #10
                    Bon, c'est en place et tout se passe bien. Comme les URL étaient déjà en "Réécriture d'URL en clair (SEF)" et "Réécriture au 'vol' des URL" mais sans suffixe, et que j'avais bossé sur les alias pour le référencement, aucun changement observé sur l'ensemble du site partie ouverte au public. Parfait.
                    Par contre, comme prévu, cela met les pages URL farfelues en 404, ce que les moteurs de recherche vont donc finir par supprimer

                    Pour la partie non ouverte au public, je me demande pourquoi vient s'ajouter cela en fin d'URL ?view=article&id=175rasarita-padottanasana&catid=87 (ce qui vient remplacer le numéro d'article et de catégorie, alors que cela ne l'est pas sur le reste du site partie ouverte au public). Ce n'est pas bien grave, vu que ces URLs ne sont pas référencées (et ne doivent pas l'être, vu que c'est dans la partie non public). Mais je suis quand même curieux de ce que j'ai oublié de cliquer...

                    Enfin, j'ai également réalisé dans un menu hors des menus présentés sur le site (où il y a un menu en allemand et un autre en français), dans un "menu All", trois sous-menus accès public en noindex/nofolow pour créer des ID pour les onglets par défaut "user" (Réinitialisation du mot de passe, Rappel de l'identifiant et Enregistrement) dans le but de ne plus voir ces pages dans Google des URL avec par exemple MONDOMAINE.com/component/users/?view=registration&Itemid=435.
                    J'ai bien pigé ta solution ? Il me semble que oui, car en vérifiant mes liens "Mot de passe oublié" ou "Identifiant oublié", ce sont bien les nouvelles URL qui apparaissent
                    Dernière édition par Joopas à 13/07/2023, 13h13

                    Commentaire

                    Annonce

                    Réduire
                    Aucune annonce pour le moment.

                    Partenaire de l'association

                    Réduire

                    Hébergeur Web PlanetHoster
                    Travaille ...
                    X