une page fantome

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • [RÉGLÉ] une page fantome

    Bonjour à tous
    si je ne suis pas dans la bonne rubrique, merci de modérer

    Mon problème dépasse mes compétences
    je vais essayer de vous le décrire simplement

    J'ai refait un site qui était anciennement sur PrestaShop
    Je n'ai pas fait de redirection des anciennes URL
    hier quand j'ai googlé "serre sur mesure"
    Google m'a donné sur la première page en troisième position
    une adresse de l'ancien site :
    Serres de jardin à l'ancienne en fer réalisées à la main par l'atelier Christophe Maltaite


    Quand j'ai suivi ce lien, j'ai ouvert une page qui n'existe pas, que je n'ai jamais créée
    Cette page est un mixe de la page d'accueil : http://www.christophemaltaite.fr/index.php/fr/
    pour le slide
    et d'une page sur une gamme de serres :


    Comment est ce possible ?

    Le phénomène à disparu
    si je refais le test j'arrive en page 8 position 3 avec l'adresse de la nouvelle page d'accueil
    Mon problème semble donc réglé, par sécurité j'essaye de mettre en place une redirection en insérant une redirection dans htaccess.txt
    RedirectPermanent /content/16-serre-de-jardin http://www.christophemaltaite.fr/index.php/fr/
    mais ça ne fonctionne pas
    cela me semble pourtant correcte ?

    merci d'avance

  • #2
    Re : une page fantome

    Si ton fichier reste nommé "htaccess.txt", il sera ignoré du serveur et ne servira à rien. Il faut qu'il soit nommé ".htaccess" pour être interprété.
    Quant à l'instruction ce que tu as mise, elle redirige christophemaltaite.fr/content/16-serre-de-jardin qui est une adresse qui n'existe pas, et apparemment, c'est le template qui gère les erreurs 404 par un retour à l'accueil sans changement d'adresse
    "Patience et longueur de temps font plus que force ni que rage..." (La Fontaine : Le Lion et le Rat) - "Il n'y a pas de problèmes; il n'y a que des solutions" (André Gide).
    MoovJla et LazyDbBackup sur www.joomxtensions.com - FaQ sur www.fontanil.info - Site pro : www.robertg-conseil.fr chez PHPNET, sites perso chez PlanetHoster + sites gérés chez PHPNET, PlanetHoster, Ionos et OVH

    Commentaire


    • #3
      Re : une page fantome

      Bonjour
      Tu as une floppée de duplicate content et surtout de 404 indexées (qui ont donc été crawlées et répondaient en 200 avant), et qui plus est pas mal de tes canonicals si j'ai bien vu n'indiquent pas la bonne url.

      Enlèves les & que j'ai mis pour ne pas te faire de mauvais liens :

      site:&christophe&maltaite&.fr
      (liste plus ou moins exhaustive de toutes les url indexées par google, aller à la fin et cliquer sur "relancer la recherche pour inclure les resultats omis)

      Et plus spécifiquement avec la commande :
      (aller à la fin et cliquer sur "relancer la recherche pour inclure les resultats omis)
      site:&christophe&maltaite&.fr inurl:15
      site:&christophe&maltaite&.fr inurl:16
      site:&christophe&maltaite&.fr inurl:17
      etc...
      site:&christophe&maltaite&.fr inurl:20
      site:&christophe&maltaite&.fr inurl:22
      etc...

      par exemple :

      &http:&//www.&christophe&maltaite&.fr/index.php/fr/serre-en-cedre/gamme-rhs/rhs-portico
      &http:&//www.&christophe&maltaite&.fr/index.php/fr/serres-rhs-freestanding/16-the-wisley.html

      Je pense qu'il y a un travail à faire sur les metas noindex, canonical, et les redirections.

      Essayes ca :

      Code:
      RewriteRule ^(.*)16-serre-de-jardin$ http://www.christophemaltaite.fr/index.php/fr/ [R=301,L]
      (edit: je n'avais pas vu pour le htaccess/.htaccess)

      Mais pourquoi garder le index.php ?

      Et d'où viennent ces 404 ? Etait-ce des url de ton ancien site, des essais que tu aurai pu faire en développant la nouvelle version en prod au lieu de le faire en dev avec disallow / ou alors des url "inventées" par googlebot (mais elles étaient forcément accessibles avant) ?
      Dernière édition par -Tony- à 11/11/2015, 11h28

      Commentaire


      • #4
        Re : une page fantome

        Merci Robert
        j'avais raté quelque chose d'important

        Merci -Tony-
        Mais tu vas trop vite dans tes explications, je suis un bleusaille qui ne demande qu'a comprendre, j'ai besoin que tu m'éclaires un peu plus.
        quand je fais site:&christophe&maltaite&.fr (en enlevant les &) je comprends que Google a encore toutes mes anciennes pages

        Je n'ai pas compris a quoi sert le inurl:15 inurl:16 inurl:17 etc que tu fais après ????? Pourquoi tu commences à 15 ? Où faut-il s’arrêter ????


        Code:
        RewriteRule ^(.*)16-serre-de-jardin$ http://www.christophemaltaite.fr/index.php/fr/ [R=301,L]
        si j'ai bien compris, je mets ce code dans le .htaccess
        Est-ce suffisant pour régler tous ces problèmes ?


        Toutes les 404, sont effectivement les url des pages de l'ancien site


        Je ne sais pas à quoi sert l'index.php, il faut le virer ??????????????????



        j'ai lu sur l'annuaire du net qu'il était important de choisir entre avec WWW et sans WWW
        je m'apprête à glisser ce code dans le .htaccess

        Code:
        Options +FollowSymlinks
        RewriteEngine on
        RewriteCond %{HTTP_HOST} ^www.christophemaltaite.fr$
        RewriteRule ^(.*) http://christophemaltaite.fr/$1 [QSA,L,R=301]
        Cela te parait correct ???


        merci de ton aide, je suis un peu dépassé
        j'ai mal préparé cette reécriture du site, je ne me suis pas assez renseigné, j'en suis très conscient.

        Commentaire


        • #5
          Re : une page fantome



          inurl : sert à reperer un terme dans une url, par exemple si je tape "inurl:component/content" je vais forcément tomber sur des sites joomla.

          intext : chercher des termes dans le body, le corps de la page

          site : chercher dans un domaine spécifique

          etc...il y en a d'autres.

          Donc tu peux faire un mix comme "site:tonsite.com inurl:tonterme" pour chercher du duplicate potentiel.
          Mais par exemple tu peux faire aussi "intitle:mon title exact" pour voir si d'autres sites utilisent le même title.
          Ou "site:tonsite.com intitle:ton title" pour reperer egalement du duplicate sur ton site.

          J'ai commencé à 15 comme ca, par hasard.
          Ca correspond à l'ID de categorie ou de l'article.

          Il faut que tu fasses un inventaire exhaustif des url de ton site.
          Que tu listes d'un coté celles qui sont légitimes et qui doivent rester, et de l'autre coté toutes celles en 404 ou celles en 200 qui sont en duplicate et où il faudra ajouter des meta noindex et/ou canonical et/ou redirections 301.

          Tu n'as pas répondu à Robert pour le htaccess/.htaccess

          Non pas du tout que ce soit la redirection que tu proposait ou celle là ne reglera le probleme que pour une seule url.
          Il te faudra faire des redirections pour chaque url
          La réécriture est plus flexible pour ca que le redirectpermanent.

          Pour le www j'aurai plutot fait ca :

          Code:
          RewriteCond %{HTTP_HOST}   !^www\.tonsite\.com [NC]
          RewriteCond %{HTTP_HOST}   !^localhost
          RewriteCond %{HTTP_HOST}   !^127\.0\.0\.1
          RewriteCond %{HTTP_HOST}   !^$
          RewriteRule ^(.*)         http://www.tonsite.com/$1 [L,R,NE,R=301]
          Pour le index.php (mais il faut cliquer sur oui dans administration/configuration/jenesais plus trop quoi avant) :

          Code:
          #Pour les url comme www.tonsite.com/index.php/ (page d'accueil)
          RewriteCond %{THE_REQUEST} ^(GET|POST|HEAD)\ (/.*)?/index.php
          RewriteCond %{THE_REQUEST} !administrator
          RewriteRule ^(.*)index.php/$ /$1 [R=301,L]
          
          #Pour les url comme www.tonsite.com/index.php/ta-page/re-tapage
          RewriteCond %{REQUEST_URI} ^/index\.php/
          RewriteCond %{REQUEST_URI} !/administrator/.* [NC]
          RewriteRule ^index.php/(.*) /$1 [R=301,NE,L]

          Fais les choses les unes après les autres....et testes bien après.
          Dernière édition par -Tony- à 11/11/2015, 20h16

          Commentaire


          • #6
            Re : une page fantome

            Envoyé par -Tony- Voir le message


            inurl : sert à reperer un terme dans une url, par exemple si je tape "inurl:component/content" je vais forcément tomber sur des sites joomla.
            intext : chercher des termes dans le body, le corps de la page
            site : chercher dans un domaine spécifique
            etc...il y en a d'autres.

            Donc tu peux faire un mix comme "site:tonsite.com inurl:tonterme" pour chercher du duplicate potentiel.
            Mais par exemple tu peux faire aussi "intitle:mon title exact" pour voir si d'autres sites utilisent le même title.
            Ou "site:tonsite.com intitle:ton title" pour reperer egalement du duplicate sur ton site.
            J'ai commencé à 15 comme ca, par hasard.
            Ca correspond à l'ID de categorie ou de l'article.
            Il faut que tu fasses un inventaire exhaustif des url de ton site.
            Que tu listes d'un coté celles qui sont légitimes et qui doivent rester, et de l'autre coté toutes celles en 404 ou celles en 200 qui sont en duplicate et où il faudra ajouter des meta noindex et/ou canonical et/ou redirections 301.
            OK, j'ai compris l'utilisation de site: et de ces commandes

            Si j'ai bien capté il faut se tarté à la main tous les résultats et faire des redirections
            tu fais des copier coller vers un TT ou un tableur pour organiser tes lignes de codes ?



            Tu n'as pas répondu à Robert pour le htaccess/.htaccess
            si si, il a eu du nez de comprendre à quel point j'étais largué , je l'ai remercié.


            Non pas du tout que ce soit la redirection que tu proposait ou celle là ne reglera le probleme que pour une seule url.
            Il te faudra faire des redirections pour chaque url
            La réécriture est plus flexible pour ca que le redirectpermanent.
            oui mais le redirectpermanent est simple à comprendre
            alors que l'écriture de RewriteRule je le comprends moins.
            il redirige plus d'adresses ???
            le ^(.*) $ il marche comment ?
            ou je peux trouver de l'info ?


            Pour le www j'aurai plutot fait ca :

            Code:
            RewriteCond %{HTTP_HOST}   !^www\.tonsite\.com [NC]
            RewriteCond %{HTTP_HOST}   !^localhost
            RewriteCond %{HTTP_HOST}   !^127\.0\.0\.1
            RewriteCond %{HTTP_HOST}   !^$
            RewriteRule ^(.*)         http://www.tonsite.com/$1 [L,R,NE,R=301]
            j'ai trouvé ces instructions sur ce lien.
            http://www.annuaire-info.com/redirec...w-et-avec-www/
            ça a l'air de fonctionner
            Je ne comprends pas la différence avec ton code, donc si tu ne donne pas les raisons de ton choix ???


            Pour le index.php (mais il faut cliquer sur oui dans administration/configuration/jenesais plus trop quoi avant) :

            Code:
            #Pour les url comme www.tonsite.com/index.php/ (page d'accueil)
            RewriteCond %{THE_REQUEST} ^(GET|POST|HEAD)\ (/.*)?/index.php
            RewriteCond %{THE_REQUEST} !administrator
            RewriteRule ^(.*)index.php/$ /$1 [R=301,L]
            
            #Pour les url comme www.tonsite.com/index.php/ta-page/re-tapage
            RewriteCond %{REQUEST_URI} ^/index\.php/
            RewriteCond %{REQUEST_URI} !/administrator/.* [NC]
            RewriteRule ^index.php/(.*) /$1 [R=301,NE,L]
            la je suis largué, est ce que tu peux être plus généreux en explications
            Fais les choses les unes après les autres....et testes bien après.
            je m'y met de suite

            Commentaire


            • #7
              Re : une page fantome

              Si j'ai bien capté il faut se tarté à la main tous les résultats et faire des redirections
              tu fais des copier coller vers un TT ou un tableur pour organiser tes lignes de codes ?
              Oui à la main un copié collé sur un bloc note.
              D'abord tu listes toutes celles accessibles via ton site et qui sont légitime.
              Puis un autre fichier de celles en 404
              Puis un autre de celles en duplicate
              Et là tu as a base de travail.

              oui mais le redirectpermanent est simple à comprendre
              alors que l'écriture de RewriteRule je le comprends moins.
              il redirige plus d'adresses ???
              le ^(.*) $ il marche comment ?
              ou je peux trouver de l'info ?
              Oui c'est vrai c'est plus simple, mais moins flexible.
              Disons qu'en écrivant beaucoup moins tu dis plus de choses.
              Fais ce avec quoi tu es à l'aise.
              Infos : apache rewrite
              ^ = commence part
              (.*) = tout ce qui se trouve
              ! = différent de
              $ = fini part
              | = ou
              etc...

              Du coup tu peux rediriger pleins de trucs d'un coup avec des rewrite rules :

              Code:
              RewriteRule ^((.*)16(.*)|salut|(.*)coucou|recoucou(.*))$ http://mondomaine.com/url-que-je-veux [R=301,L]
              Une rewrite rule annule les conditions du dessus une fois la regle appliquée :

              #Dans le cas où tout ce qui se trouve apres mon terme
              RewriteCond %{REQUEST_URI} ^/mon terme(.*)
              #Dans le cas où strictement mon terme
              RewriteCond %{REQUEST_URI} ^mon terme$
              #Dans le cas où tout ce qui se trouve avant mon terme
              RewriteCond %{REQUEST_URI} ^(.*)mon terme$
              #J'applique une regle de reecriture
              RewriteRule ma rewrite rule

              Tu peux tester tes redirections ici http://htaccess.madewithlove.be/


              Je ne comprends pas la différence avec ton code, donc si tu ne donne pas les raisons de ton choix ???
              Oui ca fonctionne aussi

              il dit = je redirige tel domaine avec www et tout ce qui ce trouve après vers tel domaine sans www et tout ce qui se trouve après

              le "mien" dit = je redirige tous les domaines et tout ce qui ce trouve après vers tel domaine avec www et tout ce qui se trouve après

              De mémoire j'avais fait ca car je redirigais en même temps rien vers www et https vers http

              Et d'où viennent ces 404 ? Etait-ce des url de ton ancien site, des essais que tu aurai pu faire en développant la nouvelle version en prod au lieu de le faire en dev avec disallow / ou alors des url "inventées" par googlebot (mais elles étaient forcément accessibles avant) ?
              Dernière édition par -Tony- à 11/11/2015, 23h48

              Commentaire


              • #8
                Re : une page fantome

                Je te remercie encore de m'accorder du temps

                Quelques questions vraiment naïves

                1- A quoi ça sert, finalement ?
                les vieilles adresses, de l'ancien site qui provoquent des erreurs 404 (ou plutôt des 500). aucun de nos client ne les ont mis en favoris. donc, que les registres de google soient pleines de lien foireux ne m'enlève pas de nouvelles visites ?

                2- Est-ce que Google va nettoyer ??
                je pourrai enlever mes RewriteRule dans qq temps ?

                3- tu me dis :
                Que tu listes d'un coté celles qui sont légitimes et qui doivent rester, et de l'autre coté toutes celles en 404 ou celles en 200 qui sont en duplicate et où il faudra ajouter des meta noindex et/ou canonical et/ou redirections 301.
                celles qui sont légitimes c'est facile je les connais
                Celle en 404 je n'en voie pas beaucoup, j'ai des 500
                en 200 ?
                en dupicate ? comment on les reconnait ?

                je ne connaissait pas ces mots avant d'ouvrir ce fil : meta noindex et/ou canonical
                est ce que je peux tout traiter avec les RewriteRule qui font des 301 (si j'ai bien compris ?)

                jm

                Commentaire


                • #9
                  Re : une page fantome

                  Et d'où viennent ces 404 ? Etait-ce des url de ton ancien site, des essais que tu aurai pu faire en développant la nouvelle version en prod au lieu de le faire en dev avec disallow / ou alors des url "inventées" par googlebot (mais elles étaient forcément accessibles avant) ?
                  oups !
                  Elles viennent d'un ancien site sous PrestaShop que j'ai remplacé à la sauvage.
                  les positionnements ne sont pas pire qu'avant, bien dans certains cas,
                  mais les visites ont chuté de 60%
                  j'essaye de comprendre comment ça fonctionne de plus près

                  Commentaire


                  • #10
                    Re : une page fantome

                    1- A quoi ça sert, finalement ?
                    les vieilles adresses, de l'ancien site qui provoquent des erreurs 404 (ou plutôt des 500). aucun de nos client ne les ont mis en favoris. donc, que les registres de google soient pleines de lien foireux ne m'enlève pas de nouvelles visites ?
                    Ca c'est ce que tu penses.
                    La question est si tu avais fait les redirections dès le début aurait tu eu plus de visites ?
                    Tu perds tout le bénéfice du poids de la page en 404 qu'avait accordé google sans le transférer à la nouvelle.
                    Tu perds touts tes backlinks sur les pages en 404...alors qu'avec une redirection le poids est transféré à la nouvelle page
                    Si je fais : allintext:&christophe&maltaite&.fr (je recherche donc sur le net les backlinks de ton site)
                    J'obtiens 614 résultats...ca m'étonnerai qu'il n'y en ai pas qui pointent vers une page en 404....

                    2- Est-ce que Google va nettoyer ??
                    je pourrai enlever mes RewriteRule dans qq temps ?
                    Euh non et renon
                    Quand tout sera ok il faudra que tu aies dans google webmaster tools/search console onglet "explorer comme google", et que tu rentres chaque ancienne url, puis tu cliques sur "explorer", puis sur "envoyer pour indexation - n'explorer que cette url", ca va faciliter la prise en compte de tes redirections. Et au fur et à mesure il va désindexer.

                    Attention du peux que j'ai vu tu rediriges tout vers ta page d'accueil => pas bien, il vaudrait mieux rediriger la page gâteau au chocolat vers la nouvelle page gâteau au chocolat plutôt que vers la couverture du livre de pâtisserie...celles à rediriger vers la page d'accueil sont celles qui n'ont pas leur équivalent.


                    Celle en 404 je n'en voie pas beaucoup, j'ai des 500
                    en 200 ?
                    en dupicate ? comment on les reconnait ?
                    Tu es allé trop vite, pas tout testé à chaque fois, les pages répondaient en 404 hier, aujourd'hui en 500, il y a une boulette quelque part
                    200 c'est OK la page existe - recherche google => codes http
                    Duplicate => le même contenu sous plusieurs url différentes
                    L'exemple que je te donnais hier :
                    &http:&//www.&christophe&maltaite&.fr/index.php/fr/serre-en-cedre/gamme-rhs/rhs-portico
                    &http:&//www.&christophe&maltaite&.fr/index.php/fr/serres-rhs-freestanding/16-the-wisley.html
                    Mais au lieu de rediriger la deuxième vers la première tu as redirigé la deuxième vers la page d’accueil...

                    je ne connaissait pas ces mots avant d'ouvrir ce fil : meta noindex et/ou canonical
                    est ce que je peux tout traiter avec les RewriteRule qui font des 301 (si j'ai bien compris ?)
                    Oui tout à fait tu peux.
                    Dernière édition par -Tony- à 12/11/2015, 09h31

                    Commentaire


                    • #11
                      Re : une page fantome

                      OK, j'ai pris en compte tous ce que tu m'a dis, en modifiant pas mal de redirection.

                      encore une question (en fait j'en ai encore plein, mais j'ai peur d'abuser)

                      comment écrire un RewriteRule qui réglerai tout ça en une seule ligne ?

                      Code PHP:
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=47[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=34[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=48[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=25[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=13[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=23[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=17[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=12[/url]
                      [url]http://christophemaltaite.fr/modules/sendtoafriend/sendtoafriend-form.php?id_product=11[/url] 

                      Tu es allé trop vite, pas tout testé à chaque fois, les pages répondaient en 404 hier, aujourd'hui en 500, il y a une boulette quelque part
                      Je commence à me demander si il ne vaudrai pas mieux que je trouve quelqu'un pour m'aider et faire les choses bien

                      Commentaire


                      • #12
                        Re : une page fantome

                        Il y a une chaine de requete (query string) c'est ce qui se trouve a partir du point d'interrogation = ?id_product=XX

                        Donc comme ca :

                        Code:
                        RewriteCond %{QUERY_STRING} ^id_product=(11|12|13|17|18|23|25|34|45|48)$
                        RewriteRule ^(.*)$ http://christophemaltaite.fr/mon-url-exacte? [R=301,L]
                        Mais non, t'as bien compris le truc, tu vas y arriver.
                        Méthode =
                        Repère une url en 500
                        enlève une redirection potentiellement foireuse => regarde si elle revient en 404
                        si oui => a corriger c'est de celle là que ca viens.
                        si non => remets là et enlèves en une autre.

                        Commentaire


                        • #13
                          Re : une page fantome

                          allez encore une si j'ose

                          le fichier htacces.txt (créé par l'installation de Joomla, je suppose) avait des lignes de commande.
                          quand j'ai mis mes RewriteRule
                          je les ais inséré dans ce fichier avant de le transformer en .htaccess sans enlever les lignes de commande.
                          est ce la bonne méthode ?

                          Il me semble que les erreurs en 500 sont apparus à partir du moment ou j'ai transformé ce fichier, d'ou ma question.

                          Commentaire


                          • #14
                            Re : une page fantome

                            Oui

                            Code:
                            ## [B]Can be commented out if causes errors, see notes above.[/B]
                            Options +FollowSymlinks
                            Options -Indexes
                            
                            ## Mod_rewrite in use.
                            
                            RewriteEngine On
                            
                            
                            #TES REDIRECTIONS ICI
                            
                            #L'ORDRE EST IMPORTANT
                            
                            #LA REDIRECTION WWW A LA FIN
                            
                            ## Begin - Rewrite rules to block out some common exploits.
                            # If you experience problems on your site block out the operations listed below
                            # This attempts to block the most common type of exploit `attempts` to Joomla!
                            #
                            # Block out any script trying to base64_encode data within the URL.
                            RewriteCond %{QUERY_STRING} base64_encode[^(]*\([^)]*\) [OR]
                            # Block out any script that includes a <script> tag in URL.
                            RewriteCond %{QUERY_STRING} (<|%3C)([^s]*s)+cript.*(>|%3E) [NC,OR]
                            # Block out any script trying to set a PHP GLOBALS variable via URL.
                            RewriteCond %{QUERY_STRING} GLOBALS(=|\[|\%[0-9A-Z]{0,2}) [OR]
                            # Block out any script trying to modify a _REQUEST variable via URL.
                            RewriteCond %{QUERY_STRING} _REQUEST(=|\[|\%[0-9A-Z]{0,2})
                            # Return 403 Forbidden header and show the content of the root homepage
                            RewriteRule .* index.php [F]
                            L'autre solution plus radicale est de commenter (# au début) toutes tes redirections et de les décommenter au fur et à mesure en testant où ca plante.

                            Commentaire


                            • #15
                              Re : une page fantome

                              Yes, j'avance !
                              mon problème venait du fichier installé avec Joomla, il a plus de lignes de commande
                              cela ne génère plus de 500 en utilisant le tien (celui ci-dessus)
                              les redirections sont presque toutes établies

                              Commentaire

                              Annonce

                              Réduire
                              Aucune annonce pour le moment.

                              Partenaire de l'association

                              Réduire

                              Hébergeur Web PlanetHoster
                              Travaille ...
                              X