Comprendre comment Google "voit" mon site

Réduire
Ce sujet est fermé.
X
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • Re : Comprendre comment Google "voit" mon site

    Envoyé par PieceOfCake Voir le message
    en décimal je vais prendre un peu de temps (j'ai que dix doigts et ça va pas suffire )
    On a inventé le copy/paste depuis quelques jours . En décimal, cela donne 3.074.457.345.618.258.602
    Christophe (cavo789)
    Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
    Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

    Commentaire


    • Re : Comprendre comment Google "voit" mon site

      Envoyé par cavo789 Voir le message
      On a inventé le copy/paste depuis quelques jours . En décimal, cela donne 3.074.457.345.618.258.602

      Oui ben on doit utiliser le même convertisseur sur internet

      Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

      Commentaire


      • Re : Comprendre comment Google "voit" mon site

        Bonjour Florence,


        Envoyé par FlodAriege Voir le message
        Ce sont les URL générées par FC pour afficher le résultat d'un clic sur le lien "dans la même catégorie".
        ...Je ne sais pas si c'est la fatigue ou la chaleur ou autre chose encore, mais j'ai comme l'impression que le contenu dupliqué s'est évaporé sur ce site. Si je ne m'amuse , mais m'amusé-je ?

        Par exemple, lorsque je relis ce post n° 49 : http://forum.joomla.fr/showthread.ph...=1#post1022391, je ne vois plus les liens comportant des numéros générant du duplicate content (du genre /a-propos/111-une-entreprise-avec-des-valeurs, en compétition avec /a-propos-qui-sommes-nous/nos-valeurs).

        Si je me trompe — ce qui est bien possible — merci de m'indiquer des liens qui montrent le contraire.

        => Aurais-tu récemment mis à niveau FlexiContent ? Ou bien est-ce un miracle (en rapport avec l'Annonciation) ? Ou bien encore ai-je besoin de vacances ?

        _______________

        Si je comprends bien, ce post du mois de mai sur le forum FlexiContent évoque directement le phénomène que tu évoques et que je pointe quasi depuis le début de ce long fil (pour ne pas dire bobine ) de discussion :
        http://flexicontent.org/forum/index....rb_v=viewtopic.

        J'ignore si le problème est résolu sur une version plus récente de FC, mais essayer une mise à niveau logicielle, si ce n'est déjà fait, pourrait peut-être se révéler une solution (comme d'habitude, toujours faire précéder cette opération d'une sauvegarde complète du site).

        Le 'changelog' de FC est ici : https://code.google.com/p/flexicontent/source/list (dernière modification en date : le 9 juillet).

        A suivre (encore, peut-être)...


        Cordialement,


        PhilJ
        Dernière édition par PhilJ à 16/07/2014, 14h55
        Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

        Commentaire


        • Re : Comprendre comment Google "voit" mon site

          Bonjour à toutes et à tous,

          Voici un article, mis à jour récemment (7 juil 2014), qui semble avoir été écrit spécifiquement pour FlodAriege : "Evitez les URLs dupliquées"
          GIMPons.net : http://www.GIMPons.net = plus de 1000 tutoriels sur GIMP , plus d'un millier d'images pour expliquer les filtres de GIMP.
          Le terrier de Fynhooft : http://patrick.gauwin.free.fr
          Le CSE d'Hazebrouck : http://www.csehazebrouck.fr

          Commentaire


          • Re : Comprendre comment Google "voit" mon site

            ...Je ne sais pas si c'est la fatigue ou la chaleur ou autre chose encore, mais j'ai comme l'impression que le contenu dupliqué s'est évaporé sur ce site. Si je ne m'amuse , mais m'amusé-je ?

            Je ne voudrais décevoir personne, mais de mon côté, les duplicate content signalées par GWT, au fil des passages des bots se promènent entre 0 et 90 environ en passant par toutes les étapes médianes, donc un peu de patience, si on ne fait rien, le duplicate content revient tout seul. Ca c'est une certitude
            Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

            Commentaire


            • Re : Comprendre comment Google "voit" mon site

              Envoyé par PhilJ Voir le message
              Bonjour Florence,

              ...Je ne sais pas si c'est la fatigue ou la chaleur ou autre chose encore, mais j'ai comme l'impression que le contenu dupliqué s'est évaporé sur ce site. Si je ne m'amuse , mais m'amusé-je ?

              Par exemple, lorsque je relis ce post n° 49 : http://forum.joomla.fr/showthread.ph...=1#post1022391, je ne vois plus les liens comportant des numéros générant du duplicate content (du genre /a-propos/111-une-entreprise-avec-des-valeurs, en compétition avec /a-propos-qui-sommes-nous/nos-valeurs).

              Si je me trompe — ce qui est bien possible — merci de m'indiquer des liens qui montrent le contraire.
              J'ai vérifié en reprenant le sitemap que Xmap avait généré, et qui contenait par exemple l'URL suivante :

              Un "mauvais" lien en somme.
              Que j'ai viré manuellement de mon sitemap.
              Quand j'essaie d'atteindre cette URL, j'atterris... sur ma page d'accueil. Comme si la page avait disparu !
              La bonne URL (canonique, c'est ça ?), est :

              Et cette "bonne" URL fonctionne nickel.

              Pourquoi la 1ère URL a-t-elle disparu ???

              Et, question subsidiaire : pourquoi diable atterris-je sur ma page d'accueil et pas sur ma page erreur 404 (qui apparaît sagement dès qu'on s'amuse, par exemple, à remplacer le nombre 111 du lien suivant par (au hasard) 112 :

              Par contre si on remplace 111 par 115, on atterrit à nouveau sur la page d'accueil, mais avec un titre "Soleil en tête" (qui se voit sur l'onglet d'IE)...
              Vérification faite : je n'ai pas d'article portant le n°112 (il a dû finir à la poubelle), par contre j'en ai un qui porte le n°115 et dont le titre est... "Soleil en tête", et qui se trouve dans la même catégorie que le n°111.
              Donc là, pour moi, ça devient carrément ésotérique, et moi j'ai signé pour faire mon site avec mes petits doigts, par pour faire de la magie noire, hein...

              Concernant les 2 URL mentionnées dans le post #49...
              Pendant un moment j'ai cru que j'avais perdu la raison et rêvé que ce "mauvais" lien eut jamais existé, mais non, quand je relis ton post #49, PhilJ, tu écris bien quelque chose qui prouve que toi aussi tu y accédais.

              "Problème" : je ne sais absolument pas ce qui a supprimé le contenu dupliqué !!!
              Qu'ai-je fait depuis le 3 juillet ?
              - j'ai nettoyé le sitemap.xml généré par xmap (je l'ai fait à la main), et ai envoyé ce sitemap à gogol
              - j'ai indiqué dans mon robots.txt à quelle URL est rangé mon sitemap
              - et... j'ai supprimé quelques liens inutiles (dépubliés) d'un menu invisible, mais qui ne renvoyaient PAS vers l'URL mentionnée ci-dessus (et vers celle du post #49). Je vies d'aller vérifier (car je ne les ai pas "jetés", juste dépubliés, au cas où), et ils sont vraiment sans rapport.

              Donc, non, PhilJ, tu ne te trompes pas, apparemment les contenus dupliqués ont disparu (peut-être pas tous, il faudra que je vérifie, mais suis trop crevée ce soir pour le faire...)
              Le truc c'est que je ne sais pas du tout ce qui s'est passé...


              Envoyé par PhilJ Voir le message
              => Aurais-tu récemment mis à niveau FlexiContent ? Ou bien est-ce un miracle (en rapport avec l'Annonciation) ? Ou bien encore ai-je besoin de vacances ?
              Non, pas de mise à jour FlexiContent.
              Un miracle ? Peut-être ....................
              Des vacances, tu y a s droit, mais tu ne sembles pas en avoir "besoin"
              _______________

              Envoyé par PhilJ Voir le message
              Si je comprends bien, ce post du mois de mai sur le forum FlexiContent évoque directement le phénomène que tu évoques et que je pointe quasi depuis le début de ce long fil (pour ne pas dire bobine ) de discussion :
              http://flexicontent.org/forum/index....rb_v=viewtopic.
              Apparemment oui, mais ça n'explique pas pourquoi, chez moi, le phénomène a disparu quelque part entre le 3 et le 17 juillet .... (tuulululululuuuuuuu tulululululuuuuuuuuuuu la vérité est ailleurs)

              Envoyé par PhilJ Voir le message
              J'ignore si le problème est résolu sur une version plus récente de FC, mais essayer une mise à niveau logicielle, si ce n'est déjà fait, pourrait peut-être se révéler une solution (comme d'habitude, toujours faire précéder cette opération d'une sauvegarde complète du site).

              Le 'changelog' de FC est ici : https://code.google.com/p/flexicontent/source/list (dernière modification en date : le 9 juillet).

              A suivre (encore, peut-être)...


              Cordialement,


              PhilJ
              Sauf si la mise à jour se fait toute seule, je ne vois pas pourquoi le changement se serait appliqué chez moi à cette date (09/07).
              Je reprends ça ce week-end (ou demain soir si j'y parviens).
              Merci encore à toi PhilJ, bonne nuit
              Dernière édition par FlodAriege à 16/07/2014, 23h35
              Flo, Ariège

              Il n'y a que celui qui a honte d'apprendre qui a peur de demander

              Commentaire


              • Re : Comprendre comment Google "voit" mon site

                Envoyé par PieceOfCake Voir le message
                Je ne voudrais décevoir personne, mais de mon côté, les duplicate content signalées par GWT, au fil des passages des bots se promènent entre 0 et 90 environ en passant par toutes les étapes médianes, donc un peu de patience, si on ne fait rien, le duplicate content revient tout seul. Ca c'est une certitude
                tu m'as pété le moral là....
                ... avoue que c'est quand même bizarre cette histoire.
                mon ménage sur sitemap.xml ne peut pas avoir fait disparaître (même temporairement) mes dupliqués, enlève moi un doute stp.
                Flo, Ariège

                Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                Commentaire


                • Re : Comprendre comment Google "voit" mon site

                  Bon allez, je voulais ouvrir un nouveau post pour ça, mais c'est toujours en rapport avec "comment Google voit-il mon site ?" donc... c'est parti pour le 114ème post de ce thread, désolée :
                  Je viens de jeter un œil aux outils webmaster Google de mon site, et je m'aperçois que :

                  a) à la rubrique 'erreurs d'exploration / erreurs du serveur', que Google se met à lister 47 URL en erreur (depuis le 9 juillet, et surtout depuis le 11).

                  Souci : 50% de ces URL sont des URL de mon ancien site (site statique) ... qui n'est plus en ligne depuis des mois !
                  Comment dire à Google d'arrêter de chercher ces vieilleries ???

                  Autre souci : les 50% restant sont les URL dont on parlait plus haut, par exemple :

                  qui atterrit sur une page 'erreur 500'
                  et qui n'est pas listée dans mon sitemap.xml (que Google déclare avoir exploré correctement, mais seulement le 16/07)

                  b) Encore un autre problème : Google affiche une erreur d'exploration du robots.txt. "exploration différée en raison d'un fichier inaccessible". Pourtant quand je vais à l'adresse http://www.rouchenergies.fr/robots.txt je vois bien mon robots.txt !

                  c) à la rubrique 'erreurs d'exploration / introuvable', Google liste 126 URL introuvables. (247 jusqu'au 114/06, et depuis ça décroit). Dans cette rubrique là, les détections d'erreurs remontent au mois de mai et sont très majoritairement de vieilles URL de mon site précédent. Que suis-je censée faire pour dire à Google que c'est (pas ?) bon, ces pages n'existent plus...

                  Allez je vais me coucher, 3 posts de suite c'est pas très joli joli, pardonnez-moi les gars
                  Flo, Ariège

                  Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                  Commentaire


                  • Re : Comprendre comment Google "voit" mon site

                    Bonjour,


                    Envoyé par fynhooft Voir le message
                    Voici un article, mis à jour récemment (7 juil 2014), qui semble avoir été écrit spécifiquement pour FlodAriege : "Evitez les URLs dupliquées"
                    ...Les remèdes sont sans doute bien indiqués, mais aucune des 7 causes de duplicate content évoquées dans l'introduction de cet article ne correspond au cas.
                    Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                    Commentaire


                    • Re : Comprendre comment Google "voit" mon site

                      Envoyé par PieceOfCake Voir le message
                      [...] les duplicate content signalées par GWT, au fil des passages des bots se promènent entre 0 et 90 environ en passant par toutes les étapes médianes, donc un peu de patience, si on ne fait rien, le duplicate content revient tout seul. Ca c'est une certitude
                      ...Je ne ne me basais pas sur les GWT. Et pour cause.
                      Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                      Commentaire


                      • Re : Comprendre comment Google "voit" mon site

                        Envoyé par FlodAriege Voir le message
                        J'ai vérifié en reprenant le sitemap que Xmap avait généré, et qui contenait par exemple l'URL suivante :

                        Un "mauvais" lien en somme. Que j'ai viré manuellement de mon sitemap. Quand j'essaie d'atteindre cette URL, j'atterris... sur ma page d'accueil. Comme si la page avait disparu !
                        La bonne URL (canonique, c'est ça ?), est :

                        Et cette "bonne" URL fonctionne nickel.

                        Pourquoi la 1ère URL a-t-elle disparu ???

                        Et, question subsidiaire : pourquoi diable atterris-je sur ma page d'accueil et pas sur ma page erreur 404 (qui apparaît sagement dès qu'on s'amuse, par exemple, à remplacer le nombre 111 du lien suivant par (au hasard) 112 :
                        http://www.rouchenergies.fr/index.ph...ec-des-valeurs
                        ...C'est bien ce que je dis : le duplicate content semble avoir disparu — au moins en partie. Dans la première URL, tu peux même remplacer 92 par 9200, la page affichée sera toujours la page d'accueil, comme si la catégorie 92 (de FC ?) avait été supprimée et comme si un mécanisme de rattrapage était à l'oeuvre (FC ?).

                        Toutefois, je précise que le phénomène semble (seulement) avoir disparu, et je parlais d'ailleurs précédemment d'impression, car par exemple quand on scrute le code source de cette drôle de page d'accueil, on trouve notamment ceci :
                        Code:
                        [INDENT]<meta name="description" content="C'est Soleil en tête qui avait fait votre installation, et vous ne les trouvez plus ? Pas de panique, Rouch Energies est toujours là !" />
                          <meta name="generator" content="Joomla! - Open Source Content Management" />
                          <title>Soleil en tête</title>
                          <link href="[URL="http://forum.joomla.fr/view-source:http://www.rouchenergies.fr/?lang=&catid=0&id=115"]http://www.rouchenergies.fr/?lang=&amp;catid=0&amp;id=115[/URL]" rel="canonical" />
                          <link href="[URL="http://forum.joomla.fr/view-source:http://www.rouchenergies.fr/index.php/a-propos-qui-sommes-nous/soleil-en-tete"]http://www.rouchenergies.fr/index.php/a-propos-qui-sommes-nous/soleil-en-tete[/URL]" rel="canonical" />
                        [/INDENT]
                        ...Autrement dit, n'importe quoi :-\

                        Par contre si on remplace 111 par 115, on atterrit à nouveau sur la page d'accueil, mais avec un titre "Soleil en tête" (qui se voit sur l'onglet d'IE)...
                        Vérification faite : je n'ai pas d'article portant le n°112 (il a dû finir à la poubelle), par contre j'en ai un qui porte le n°115 et dont le titre est... "Soleil en tête", et qui se trouve dans la même catégorie que le n°111.
                        ...Là, c'est différent : 111 n'est pas un ID de catégorie mais d'article.

                        Tout cela me donne à penser que quelque chose ne va peut-être pas dans la structure du site — et pas seulement à cause de la seule extension FlexiContent. Mais il est vraiment difficile de s'y retrouver sans pouvoir inspecter les choses « de l'intérieur » :-\
                        Dernière édition par PhilJ à 17/07/2014, 02h14
                        Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                        Commentaire


                        • Re : Comprendre comment Google &quot;voit&quot; mon site

                          Envoyé par FlodAriege Voir le message
                          tu m'as pété le moral là... avoue que c'est quand même bizarre cette histoire.
                          ...Ce n'est pas bizarre, ce n'est pas démoralisant, et PieceOfCake a raison. Le répertoire des erreurs des GWT n'est pas mis à jour en temps réel. De mon côté, j'observe que les 7 pages d'un petit site vitrine ne sont vraiment bien indexées qu'au bout de 15 jours. C'est beaucoup plus pour un site touffu.

                          A fortiori, dans le cas d'un site en développement ou en cours de remaniement — surtout profond, on ne devrait donc pas du tout s'y fier.

                          Je ne peux que me répéter : dans le cas général, XENU est un bien meilleur ami que le relevé d'erreurs des Google Webmaster Tools. On peut même dire que dans le cas particulier où on ne sait plus trop ce qui se trouve où, quelle page est liée à quelle autre page et de quelle façon, un tel outil est même insurpassable car il analyse tous les liens du site en temps réel : si XENU trouve une erreur, il l'identifie tout de suite et fournit la ou les URL qui est (ou sont) à l'origine de l'erreur, tout cela dans une liste très claire — qui n'est pas proposée par les GWT. Les GWT, au contraire, sont capables de ne pas signaler des erreurs récentes. Inversement, si XENU ne trouve pas d'erreur, c'est que vraiment il n'y en a pas, et il le dit aussi — contrairement aux GWT, qui signalent assez souvent des erreurs déjà corrigées (d'où ton constat étonné : « 50% de ces URL sont des URL de mon ancien site (site statique) ... qui n'est plus en ligne depuis des mois »).


                          Que suis-je censée faire pour dire à Google que c'est (pas ?) bon, ces pages n'existent plus...
                          ...Il est toujours possible de marquer les erreurs repérées par les GWT, et qui ont été corrigées, comme 'CORRIGÉES'. Cela dit, (1°) Google finit toujours par s'auto-corriger, et (2°) il n'est pas sûr que ce marquage produise un effet, en tout cas un effet immédiat.
                          Dernière édition par PhilJ à 17/07/2014, 02h10
                          Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                          Commentaire


                          • Re : Comprendre comment Google &quot;voit&quot; mon site

                            ...Il est toujours possible de marquer les erreurs repérées par les GWT, et qui ont été corrigées, comme 'CORRIGÉES'. Cela dit, (1°) Google finit toujours par s'auto-corriger, et (2°) il n'est pas sûr que ce marquage produise un effet, en tout cas un effet immédiat.
                            Effectivement, les marquer comme CORRIGÉES est absolument sans effet (hormis de les faire disparaître 24 ou 48h). Par contre il est tout à fait possible de demander à GWT de supprimer les pages archivées (surtout comme dans ce cas elles référencent un 'vieux' site : Ça me fait toujours drôle quand vous parlez de 'vieux' comme ça, faudrait trouver un autre terme ça me chagrine quelque part )

                            GWT > Index Google > Url à supprimer. Les urls ne sont pas supprimés instantanément, mais globalement sous 24h ça corrige bien ce genre de situation y compris avec les urls pointant sur des pages archivées par Google
                            Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                            Commentaire


                            • Re : Comprendre comment Google &quot;voit&quot; mon site

                              Souci : 50% de ces URL sont des URL de mon ancien site (site statique) ... qui n'est plus en ligne depuis des mois !
                              Comment dire à Google d'arrêter de chercher ces vieilleries ???
                              il faut desavouer ces url ds les GWT..... et comme ca GG ne les chercheras plus.....

                              PS tu as quoi ds le composant de redirection de ton site?

                              Commentaire


                              • Re : Comprendre comment Google &quot;voit&quot; mon site

                                Envoyé par PhilJ Voir le message
                                (...)
                                comme si la catégorie 92 (de FC ?) avait été supprimée et comme si un mécanisme de rattrapage était à l'oeuvre (FC ?).
                                (...)
                                J'ai vérifié : la catégorie portant l'ID 92 est toujours en place, c'est la catégorie Pompe à chaleur air-eau.


                                Envoyé par PhilJ Voir le message
                                (...)quand on scrute le code source de cette drôle de page d'accueil, on trouve notamment ceci :
                                Code:
                                [INDENT]<meta name="description" content="C'est Soleil en tête qui avait fait votre installation, et vous ne les trouvez plus ? Pas de panique, Rouch Energies est toujours là !" />
                                  <meta name="generator" content="Joomla! - Open Source Content Management" />
                                  <title>Soleil en tête</title>
                                  <link href="[URL="http://forum.joomla.fr/view-source:http://www.rouchenergies.fr/?lang=&catid=0&id=115"]http://www.rouchenergies.fr/?lang=&catid=0&id=115[/URL]" rel="canonical" />
                                  <link href="[URL="http://forum.joomla.fr/view-source:http://www.rouchenergies.fr/index.php/a-propos-qui-sommes-nous/soleil-en-tete"]http://www.rouchenergies.fr/index.php/a-propos-qui-sommes-nous/soleil-en-tete[/URL]" rel="canonical" />
                                [/INDENT]
                                ...Autrement dit, n'importe quoi :-\(...)
                                C'est quoi cette balise rel canonical ???
                                Aurais-je activé quelque chose par erreur ???
                                Je ne savais même pas ce que ça veut dire jusqu'à ce que quelqu'un (toi ?) commence à en parler dans ce fil...
                                Dernière édition par FlodAriege à 17/07/2014, 11h07
                                Flo, Ariège

                                Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                                Commentaire

                                Annonce

                                Réduire
                                Aucune annonce pour le moment.

                                Partenaire de l'association

                                Réduire

                                Hébergeur Web PlanetHoster
                                Travaille ...
                                X