Indexation et pages obsolètes ?

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • Indexation et pages obsolètes ?

    Bonjour,

    Y aurait-il une solution pour forcer les moteurs d'indexation à oublier des pages devenues obsolètes ?
    J'ai par exemple des pages considérées "Page en double sans URL canonique sélectionnée par l'utilisateur", pages correspondant à d'anciens événements et donc plus disponibles, sans erreur 404 mais seulement une mention de l'extension.
    Je me pose d'ailleurs la question de l'intérêt d'indexation de ces pages d'événements qui sont des séances d'examens régulièrement proposées.

    Merci de vos avis !
    "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
    MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

  • #2
    Bonjour Robert,
    Les pages sont-elles toujours publiées, dépubliées, ou archivées ?

    Une solution peut être de les mettre en "archivé". Tu peux ensuite faire une ligne de code dans default.php du type : ne pas indexer les pages archivées.

    Commentaire


    • #3
      Bonjour,

      Ces pages correspondent à des événements passés qui ne s'affichent plus sur le site
      "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
      MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

      Commentaire


      • #4
        Pour que les moteurs de recherche "oublient" des pages obsolètes, il faut que celles-ci aient le statut 404. Après "un certain temps", ces pages sont retirées des index.
        Si par contre elles n'ont pas ce statut, il faut bloquer leur indexation dans le fichier "robots.txt", puis demander la suppression dans la Search Console (pour Google).
        Tous les services pour les sites Joomla! : sécurité, nettoyage de sites piratés, hébergement, SEO, applications Fabrik, migration, compatibilité mobiles, accessibilité, ...
        Administrateur certifié Joomla! 3
        https://www.betterweb.fr

        Commentaire


        • #5
          Merci jfque !

          En fait, on se retrouve avec des tas de pages que Google veut indexer alors qu'il s'agit de pages soit déjà en 404 depuis des mois, soit définies en noindex, sans compter celles avec la mention que je cite plus haut.
          Par exemple, pour la page d'accueil j'ai une balise canonical sans index.php et une autre avec dans les deux adresses d'accès. Est-ce la faute de Joomla! ? Comment gérer ça ?
          Comment expliquer par exemple qu'on puisse retrouver dans la Search Console une adresse de plan de site "plan-du-site?view=html&id=1" (plan OSmap avec cette adresse dans la barre) avec en canonical "plan-du-site?view=html&id=1" ET "plan-du-site" ?

          Pour les événements passés, on a soit une erreur 404, soit l'affichage de la page sans autre contenu dans la partie composant que ce message "The event you are trying to register is not found". Pour une page de ce type on a deux balises canonical, alors que sur un événement à venir, on n'en a qu'une.
          "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
          MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

          Commentaire


          • #6
            Pour ma part j'ai plein de pages qualifiées "Page en double sans URL canonique sélectionnée par l'utilisateur" et pages en "erreur 404" qui ne correspondent à aucune page, ni actuelles ni passées. Pour partie ce sont des url erronées du type : https://monsite/categorie?layout=blog ou avec d'autres suffixes, start, fbclid, etc. Je vais essayer de faire des suppressions dans le htaccess du type :
            RewriteCond %{REQUEST_URI} ^/$
            RewriteCond %{QUERY_STRING} (^|&)fbclid=[^&]+ [NC,OR]
            RewriteCond %{QUERY_STRING} (^|&)m=\d+ [NC,OR]
            RewriteCond %{QUERY_STRING} (^|&)cat=\d+ [NC,OR]
            RewriteCond %{QUERY_STRING} (^|&)paged=\d+ [NC,OR]
            RewriteCond %{QUERY_STRING} (^|&)start=\d+ [NC]
            RewriteCond %{QUERY_STRING} (^|&)layout=\d+ [NC]​

            Commentaire


            • #7
              Je me suis aussi souvent demandé où Google pouvait trouver des pages inexistantes... et pourquoi des pages en erreur 404 repérées depuis des mois sont encore répertoriées. Ou encore qu'on ait une alerte pour des pages en noindex

              Pour l'accueil, je viens de retrouver le conseil de daneel d'utiliser Gestion stricte d'index.php dans le plugin système SEF
              Dernière édition par RobertG à 10/05/2025, 07h19
              ManuelVoileux aime ceci.
              "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
              MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

              Commentaire


              • #8
                Merci du renseignement. je vais mettre Gestion stricte d'index.php dans le plugin système SEF en espérant que ça fasse quelque chose et tester mon code htaccess.

                Commentaire


                • #9
                  En tout cas, la page d'accueil accessible avec et sans index.php n'a plus qu'une adresse sans le nom du fichier et un seul lien canonique.
                  "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
                  MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

                  Commentaire


                  • #10
                    Envoyé par RobertG Voir le message
                    En tout cas, la page d'accueil accessible avec et sans index.php n'a plus qu'une adresse sans le nom du fichier et un seul lien canonique.
                    Sur la page d'accueil, je n'avais pas remarqué de problème, mais sur d'autres oui, plusieurs url "alternates"
                    <link href="/philosophie-et-societe?format=feed&amp;type=rss" rel="alternate" type="application/rss+xml" title="Société">
                    <link href="/philosophie-et-societe?format=feed&amp;type=atom" rel="alternate" type="application/atom+xml" title="Société">
                    <link href="https://philosciences.com/philosophie-et-societe" rel="canonical"> ​[/HTML].
                    Alors que je n'ai jamais attribué de flux atom ou rss à cette page. J'avais aussi des layout=blog sans fondement.
                    Une partie des url fantaisiste viennent de ces attributions abusives.
                    Je vais tester mon code de suppression dans le .htaccess et je t'informerai du résultat.

                    Commentaire


                    • #11
                      Pr défaut, les flux sont activés. Vérifie dans les paramètres généraux des articles
                      "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
                      MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

                      Commentaire


                      • #12
                        Merci de la précision. J'ai désactivé l'extension il y a quelque temps . Je vais vérifier dans les paramères généraux.

                        Commentaire


                        • #13
                          Bonjour,
                          Peut être un plan de site (sitemap.xml par exemple) qui n'est pas ajourné ?

                          Commentaire


                          • #14
                            Bonjour,
                            Le plan de site est géré par OSmap, et donc toujours à jour. Ce qui est difficilement compréhensible est la récupération par Google d'adresses qui ne sont pas dans le plan.
                            Par ailleurs, pour les événements, Google en trouve en "noindex" et rouspète, mais s'étonne de ne pas trouver certains d'entre eux, anciens...
                            J'imagine que ça va te conforter dans ton amour pour Google.
                            "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
                            MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET/NUXIT, sites perso chez PlanetHoster + sites gérés chez PHPNET/NUXIT, PlanetHoster et OVH

                            Commentaire


                            • #15
                              J'ai mis au point le script pour le .htaccess et il fonctionne, retournant 80% des url 404 ou en double vers la page d'accueil.
                              Sauf que, comme il en reste 20% la validation est considérée comme échec par la GSC et toutes les pages restent en 404 ou en double. Même celles qui ne le sont plus. Je suppose qu'avec le temps le nombre va diminuer. Enfin, c'est contrariant.

                              Ou bien, il y a une logique que je ne comprends pas. Il est normal que ces pages inexistantes ne sont pas indexées ni diffusées sur Google, mais pourquoi les répertorier ?
                              Dernière édition par pjuignet à 12/05/2025, 10h33

                              Commentaire

                              Annonce

                              Réduire
                              Aucune annonce pour le moment.

                              Partenaire de l'association

                              Réduire

                              Hébergeur Web PlanetHoster
                              Travaille ...
                              X