pattern redirection htaccess

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [Problème] pattern redirection htaccess

    Bonjour,

    J'ai vu avec stupeur que la page d'accueil du site https://www.onsort.eu/fr/ (ndd plusieurs années et refais en début d'année avec joomla à la place de wp) n'était pas indexé en mettant "onsort.eu" dans le moteur de recherche google. En allant dans la console GG , je n'arrive pas à la faire réindexer. C'est là que je me suis aperçu qu'il y avait des milliers d'urls (probablement ancien site) dans la colonne url exclue car "Anomalie lors de l'exploration" dont la page d'accueil du site (cela fait mauvais genre!). Toutes en dehors de quelques bonnes urls actuelles donnent une erreur 404.
    J'ai vu qu'il fallait absolument enlever ces urls avec erreur 404 car Google ne le faisait pas naturellement.
    Les pages exclues et que les urls (image) sont :
    * essentiellement du spam
    * anciennes urls wordpress qui avait une faille
    aucunes n'ony leur place dans l'index.
    * quelques urls correctes dont la racine du site :-(

    Je pense avoir une solution qui va m'éviter de déprimer trop rapidement. A cette heure, je n'ai pas eu de réponse dans une discussion sur WebrankInfo et il semble que le cas soit difficile, les actions pouvant aggraver la situation et le temps de prise en compte assez long Du coup j'aurai besoin que des "experts SEO" valident la méthode proposée (pour que je n'aggrave pas la situation) voir en la détaillant. Pas sûr que des extensions mefacilitent le travail mais si c'est le cas (je pensai à sh404SEF ou autres) merci de me l'inidquer. Le pus important étant de valider ce qui suit:

    Etape 1
    je récupère les urls exclues à partir de la console GG dans un fichier csv

    Etape 2
    je fais le ménage en enlevant les bonnes urls dont celle de la page accueil

    Etape 3
    Je mets la liste de ces urls et je crée une page cachée sur le site ou un sitemap renvoyée à GG

    Etape 4
    Je dois faire un redirectpermannt 410 de cette même liste (c'est là ou je ne sais pas si c'est obligatoire, vivement conseillé ...)

    J'ai vu aussi ici et ailleurs l'idée de réinjecter ces urls (en enlevant les bonnes urls code 200 bien sûr) dans un sitemap et le soumettre à Google.
    J'ai compris que l'article que je cite n'est plus actualisé. néanmoins la question maintenant c'est si c'est obligatoire ou fortement conseillé de remplir le htaccess avec toutes ces urls avec un redirect 410 !?

    réponse aux questions daneel par ailleurs:
    redirections avec le composant ou le fichier htaccess: Non
    bloqué les tentatives de hack et amélioré la sécurité de ton site (CSP, HSTS...): oui avec extension security check pro
    réalisé un plan de site et soumis à google: ben non j'entrais dans la phase de référencement (j'envisage jsitemap)

    Bonne journée
    {"data-align":"none","data-size":"full","data-attachmentid":2007241}
    Fichiers joints
    Dernière édition par herve à 04/10/2019, 15h53
    Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

  • #2
    Salut,
    voici plutôt le tableau des urls exclues:
    Anomalie lors de l'exploration -> 2 052
    Exclues Soft 404 -> 498
    Exclues Page en double sans URL canonique sélectionnée par l'utilisateur -> 359
    Exclues Explorée, actuellement non indexée -> 87
    Exclues Exclue par la balise "noindex" -> 32
    Exclues Page en double : Google n'a pas choisi la même URL canonique que l'utilisateur -> 10
    Exclues Page avec redirection -> 10
    Exclues Introuvable (404) -> 5

    Je n'ai tjs pas commencé à appliquer la méthode qui découle de mon analyse. Est-ce que des personnes avec expériences peuvent me confirmer que c'est bon, voir détailler ou donner alternative ?
    merci
    @+
    Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

    Commentaire


    • #3
      Salut Hervé,

      Ton site est-il multilingue, si ce n'est pas le cas, pourquoi redirige t'il vers /fr?
      - Check ton site avec Screaming Frog (tu verras les pages les pages qui sont Ok et les autre (404, etc)
      - Vérifie que toutes les urls sont bonnes au niveau du site et fait les modifs si nécessaire (Tu peux utiliser SH404SEF qui te facilitera la tache
      - Une fois que tout est carré, fais le ménage dans la search console

      Commentaire


      • #4
        Bonjour,
        Envoyé par Ewil79 Voir le message

        Ton site est-il multilingue, si ce n'est pas le cas, pourquoi redirige t'il vers /fr?
        - Check ton site avec Screaming Frog (tu verras les pages les pages qui sont Ok et les autre (404, etc)
        - Vérifie que toutes les urls sont bonnes au niveau du site et fait les modifs si nécessaire (Tu peux utiliser SH404SEF qui te facilitera la tache
        - Une fois que tout est carré, fais le ménage dans la search console
        merci pour ta contribution.
        Effectivement le site est(sera) multilangue.
        Pour l'instant j'ai la liste sortie de gg. Est-ce que "Screaming Frog" permet automatiquement de séparer les bonnes/mauvaises urls ?
        Qu'entends tu par faire le ménage dans la search console ?

        Sinon les questions du moment sont de faire des régles dans le htaccess pour virer au plus vite ces spams (j'ai trouvé le term "buy", "******" qui revient souvent) et anciennes urls de wp:

        Code:
         RewriteCond %{REQUEST_URI} .*/wp-content/.*  
        RewriteRule .* index.php [R=410,L]
        RewriteCond %{REQUEST_URI} .*/buy/.*
        RewriteRule .* index.php [R=410,L] ou  
        
        redirect 410 /wp-content/
        Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

        Commentaire


        • #5
          salut
          toujours coincé sur ces codes à mettre dans le htaccess
          Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

          Commentaire


          • #6
            Oui Screaming Frog te permet de distinguer les URL en code 200 des autres.

            Attention à la gestion multilingue qui doit être très rigoureuse car elle crée autant de page qu'il y a de langue, attention notamment au redirections.

            Concernant la search console, il s'agit de "nettoyer l'index de Google" des pages devenues obsolète https://support.google.com/websearch.../6349986?hl=fr
            Pour récupérer cette liste, direction le menu "couverture" de la search console. Tu peux aussi taper la requête "site:site:www.onsort.eu" pour voir quel page Google à indexer.

            Enfin, pour le htaccess, utilise un composant type SH404SEF qui fera les redirection automatiquement et/ou aesecure de christophe avonture qui te permet d'éditer un HTACCESS ultrapropre permettant de renforcer la sécurité du site et d'éditer simplement tes redirections.

            Bien à toi.


            Commentaire


            • #7
              salut

              Merci pour ta réponse, mais la question qui est la seule importante pour moi en ce moment est de savoir si ces règles sont correctes.
              r
              Code HTML:
                RewriteCond %{REQUEST_URI} .*/wp-content/.*   RewriteRule .* index.php [R=410,L] RewriteCond %{REQUEST_URI} .*/buy/.* RewriteRule .* index.php [R=410,L] ou    redirect 410 /wp-content/
              Si quelqu'un pouvait me répondre la dessus. Je change d'ailleurs le titre pour être plus clai
              @+
              Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

              Commentaire


              • #8
                Bonjour

                As-tu ... testé ? Qu'as-tu réussi à écrire pour l'instant comme lignes de redirection ?

                Note: tu l'auras vu mais tu as fait un copier/coller de lignes concernant WordPress et non Joomla. Aucune chance qu'un wp-content quelque chose fonctionne sur un site Joomla.
                Christophe (cavo789)
                Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
                Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

                Commentaire


                • #9
                  Bonjour,

                  J'ai l'impression, Christophe, qu'Hervé veut gérer des redirections pour les adresses bidon que des spammeurs ou pirates utilisent, avec des pages 404 en réponse (et dont je me demande comment Google peut les référencer).
                  "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
                  MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET, sites perso chez PlanetHoster + sites gérés chez PHPNET, PlanetHoster, Ionos et OVH

                  Commentaire


                  • #10
                    Okido cela n'empêche pas de tester de son côté.. Ce type d'exemples pullulent sur le net.

                    Un petit site de tests et hop on peux tester sans rien casser.
                    Dernière édition par cavo789 à 07/10/2019, 22h08
                    Christophe (cavo789)
                    Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
                    Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

                    Commentaire


                    • #11
                      Salut
                      Je souhaite effectivement bénéficier des compétences de personnes confirmés dans ce domaine car des exemples pullulent sur le web (avec le meilleur comme le pire) et je n’ai pas les compétences pour les distinguer. Pour l'instant je ne fais pas de site de tests car la prise en compte peut-être très longue (et donc rien aa voir avec des sites des tests que j'ai par ailleurs pour voir immédiatement le résultat)
                      @+
                      Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

                      Commentaire


                      • #12
                        En fait, Hervé dit clairement dans son premier post que la page était sous WP avant d'être basculée sur Joomla en début d'année et donc il est normal de trouver une tonne de scories d'urls WP qui trainent encore sur l'indexation Google et débouchant sur des 404. Que dit Google sur le sujet ? Qu'il faut patienter car les urls vétustes qui conduisent sur des 404 seront automatiquement désindexées !
                        "Si vous n’êtes pas impliqués émotionnellement dans ce que vous créez, laissez tomber."
                        https://www.graphiquedesign-bf.com/

                        Commentaire


                        • #13
                          Bonjour,
                          Envoyé par GraphiqueDesign Voir le message
                          En fait, Hervé dit clairement dans son premier post que la page était sous WP avant d'être basculée sur Joomla en début d'année et donc il est normal de trouver une tonne de scories d'urls WP qui trainent encore sur l'indexation Google et débouchant sur des 404. Que dit Google sur le sujet ? Qu'il faut patienter car les urls vétustes qui conduisent sur des 404 seront automatiquement désindexées !
                          Je l'ai dis pour wp après il y a aussi des urls de spammeurs.
                          Cela fait des jours que je lis tout et son contraire sur ce sujet. J'aurai tendance à faire confiance à des articles sur des experts comme webrankinfo ou autres qui disent que beaucoup trop d'urls à problème/bonnes urls font se répercuter/décrédibiliser (appelez le comme voulez) le site en question.

                          Maintenant j'ai bien entendu/lu tous les avis, je souhaite vraiment tester des pattern pour faire des redirections.
                          Si quelqu'un un jour à l'info qu'il n'hésites pas
                          Code HTML:
                            RewriteCond %{REQUEST_URI} .*/wp-content/.*  
                          RewriteRule .* index.php [R=410,L]
                          RewriteCond %{REQUEST_URI} .*/buy/.*
                          RewriteRule .* index.php [R=410,L] ou    
                          redirect 410 /wp-content/
                          Bonne journée
                          Dernière édition par herve à 08/10/2019, 09h04
                          Faciliter l'adoption du meilleur du Libre auprès du grand public https://clibre.eu/ - Connaissez-vous des communicants ... pour promouvoir joomla ? https://forum.joomla.fr/forum/th%C3%...mouvoir-joomla

                          Commentaire


                          • #14
                            Je confirme ce que GraphiqueDesign dit : la destinée des pages 404 est d'être retirée automatiquement de l'index. La seule différence entre un code 404 et un 410 semble être le délai de prise en compte par Google, comme le confirme cet article : https://www.abondance.com/20140415-1...fferences.html
                            Par contre, on parle de 24 h, donc depuis le temps ces pages ont été sûrement supprimées. Ce n'est pas parce qu'elles apparaissent dans la Search Console qu'elles se trouvent encore dans l'index. Tout dépend de la date du passage du robot d'indexation. Vérifiez à côté de ces URL la date de dernière détection. Il est courant que ces date remontent à plusieurs semaines, voire plusieurs mois. Elles disparaîtront donc au prochain passage.
                            Pour avoir une idée des URL qui sont encore indexée et dont il faudrait se débarrasser (pubs pour le ****** par exemple), tapez "sitensort.eu" et "site:www.onsort.eu" dans la fenêtre de recherche de Google. Vous verrez les pages encore indexées (pas beaucoup de résultats). Celles à problèmes devraient être retirées de l'index dans la Search Console.
                            Pour le reste, il faut patienter un peu et se concentrer sur le nouveau contenu.
                            Tous les services pour les sites Joomla! : sécurité, nettoyage de sites piratés, hébergement, SEO, applications Fabrik, migration, compatibilité mobiles, accessibilité, ...
                            Administrateur certifié Joomla! 3
                            https://www.betterweb.fr

                            Commentaire

                            Annonce

                            Réduire
                            Aucune annonce pour le moment.

                            Partenaire de l'association

                            Réduire

                            Hébergeur Web PlanetHoster
                            Travaille ...
                            X