Comprendre comment Google "voit" mon site

Réduire
Ce sujet est fermé.
X
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • #91
    Re : Comprendre comment Google "voit" mon site

    Bon ! Vous voilà prêts … alors :

    • placez-vous dos-à-dos puis avancez chacun de quinze pas
    • retournez-vous et armez … votre ordinateur !


    La suite quand vous aurez choisi le pré de ce duel (arrêt à la première blessure !)
    Dans le chaos du compliqué, trouver la solution simple qui n'est pas simpliste, car elle permet le complexe !
    https://www.pensees-vagabondes.fr
    https://www.markagement.com

    Commentaire


    • #92
      Re : Comprendre comment Google "voit" mon site

      la balise rel=canonical est surtout a utiliser quand d autres sites pompent le contenu du votre sans votre accord.
      Ou alors, il faut l'integrer des la création du site pour proteger le contenu de celui ci.
      Dans le cas présent, je me pose des questions quand a son utilité.
      Sans voir le site, dur de comprendre deja pourquoi le meme contenu existe sur deux pages differentes du meme site......

      Commentaire


      • #93
        Re : Comprendre comment Google "voit" mon site

        Envoyé par lefabdu51 Voir le message
        la balise rel=canonical est surtout a utiliser quand d autres sites pompent le contenu du votre sans votre accord.
        Ou alors, il faut l'integrer des la création du site pour proteger le contenu de celui ci.
        Dans le cas présent, je me pose des questions quand a son utilité.
        Sans voir le site, dur de comprendre deja pourquoi le meme contenu existe sur deux pages differentes du meme site......
        Pas du tout Lefabdu : tu as mal compris, il ne s'agit pas de deux pages différentes, il s'agit de deux urls différentes qui (bien entendu) référencent un seul et même article physique, mais qui par le jeu des urls multiples et du mauvais traitement des CMS en général sur ce genre de cas (et Joomla! ne déroge pas à la règle générale) laissent à penser à Google qu'il y a deux articles physiques différents d'où le duplicate content et le besoin de le traiter avec des rel=canonical (canonical que Joomla! intègre désormais en standard mais avec 25% d'erreurs en gros).

        En outre si un autre site pompe le contenu de ton site sans ton accord, je doute que la meta rel=canonical ne résolve le problème (hélas)
        A lire absolument : https://support.google.com/webmaster...r/139066?hl=fr
        Dernière édition par PieceOfCake à 14/07/2014, 17h09
        Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

        Commentaire


        • #94
          Re : Comprendre comment Google "voit" mon site

          Salut les gars,

          Ben je vois qu'on ne s'ennuie pas ici, en mon absence
          Alors la question du jour (pas réussi à retrouver le post à quoter dans les ... heu...94 posts (!) précédents ) porte sur le fichier robots.txt, que j'ai découvert grâce à ce thread :

          En début de fichier, je lis :

          # If the Joomla site is installed within a folder such as at
          # e.g. www.example.com/joomla/ the robots.txt file MUST be
          # moved to the site root at e.g. www.example.com/robots.txt
          # AND the joomla folder name MUST be prefixed to the disallowed
          # path, e.g. the Disallow rule for the /administrator/ folder
          # MUST be changed to read Disallow: /joomla/administrator/

          Or, à ce jour :
          - mon site est en effet installé dans un dossier, et non à la racine du site (obligatoire quand on est chez 1&1, sinon ça bug), disons que mon domaine pointe vers : http://www.monsite.fr/dossier-d-installation/
          - mon robots.txt est pour l'instant toujours à sa place, à savoir à l'intérieur du dossier-d-installation

          J'aurais bien envie, en lisant tout ça, de déplacer mon robots.txt à la racine de ce que je vois sous filezilla, mais en même temps, l'URL www.monsite.fr pointe bien vers dossier-d-installation...
          Par exemple, mon dossier images n'est PAS là : www.monsite.fr/dossier-d-installation/images/
          Il est là : www.monsite.fr/images/
          ... même si physiquement, quand je regarde dans filezilla, il est là : /dossier-d-installation/images/
          ... j'y comprends rien...
          Que dois-je faire ?

          Et dans le cas où je doive le déplacer à la racine de mon domaine, dois-je aussi insérer des lignes pour interdire l'indexation du contenu des autres dossiers d'installation toujours présents (installations précédentes, par exemple : dossier-d-installation-1, dossier-d-installation-2, etc

          Pas très clair, hein ? Désolée, c'est que je n'y comprends pas grand chose, et ce qui se conçoit mal s'énonce... pas clairement

          Merci pour la précision.

          PS : je travaille sur une version (locale) avec lien séparateur et "tables d'orientation", à quel moment devrai-je prévoir les redirections ??
          Flo, Ariège

          Il n'y a que celui qui a honte d'apprendre qui a peur de demander

          Commentaire


          • #95
            Re : Comprendre comment Google "voit" mon site

            Envoyé par FlodAriege Voir le message
            Salut les gars,

            Ben je vois qu'on ne s'ennuie pas ici, en mon absence
            Bah ! Oui : on ne savait plus trop bien comment aller jusqu'à au moins 10 pages et 100 posts, et comme tu n'étais plus là pour nous inonder de questions, alors...


            mon site est en effet installé dans un dossier, et non à la racine du site (obligatoire quand on est chez 1&1, sinon ça bug)
            ...Encore une bonne raison de dire, au sujet de cet hébergeur, et en paraphrasant Gaston (Lagaffe) : si on avait inventé la roue, il se serait débrouillé pour mettre tout de suite des bâtons dedans .


            J'aurais bien envie, en lisant tout ça, de déplacer mon robots.txt
            Hum. Moi je sais bien ce que je déplacerais si j'étais toi. Ce ne serait pas seulement un fichier...


            Alors la question du jour [...] porte sur le fichier robots.txt, que j'ai découvert grâce à ce thread :

            En début de fichier, je lis :

            # If the Joomla site is installed within a folder such as at
            # e.g. www.example.com/joomla/ the robots.txt file MUST be
            # moved to the site root [...]


            Que dois-je faire ?
            ...Pas sûr à 100 % de la réponse, mais si l'on en croit l'avertissement standard présent dans le fichier — et que tu reproduis d'ailleurs ici — le fichier robots.txt doit être placé à la racine de l'hébergement (« to the site root »). C'est également ce que dit Google ici : https://support.google.com/webmaster...er/40361?hl=en. => A confirmer par plus savant que moi.


            Et dans le cas où je doive le déplacer à la racine de mon domaine, dois-je aussi insérer des lignes pour interdire l'indexation du contenu des autres dossiers d'installation toujours présents (installations précédentes, par exemple : dossier-d-installation-1, dossier-d-installation-2, etc
            Si c'est le cas (= robots.txt à la racine du domaine), en effet, il faut faire en sorte que les bots n'aillent pas fouiner dans les anciennes installations.

            Mais : pourquoi conserver ces vieilleries en ligne ? C'est en préparation d'un vide grenier ?


            je travaille sur une version (locale) avec lien séparateur et "tables d'orientation", à quel moment devrai-je prévoir les redirections ??
            ...Là, c'est sûr et certain : en même temps ce sera vraiment le mieux (= intervention dans le robots.txt), car sinon l'ami Google va patauger un bon moment avant de retrouver ses billes entre le moment de la mise en service du site rénové et le moment de la mise en place des redirections (et retrouver des billes dans un marais n'est certainement pas chose facile ).

            Ou alors : tu mets le site rénové en ligne nuitamment et en catimini, de façon que les internautes en quête de chauffe-eau n'y voient que du feu (<= il n'y a pas de jeu de mots, enfin si, j'avoue). Tu déclenches le maximum d'erreurs 404 en cliquant comme une folle depuis le fichier HTML de XENU (...que tu as pieusement conservé, hmm ? n'est-ce pas ? hein ?). Puis, sans plus tarder, tu te rends dans le composant 'Redirections' de Joomla, et tu corriges les erreurs que tu as déclenchées (comme une folle). Et hop, c'est réglé — sans même bidouiller le robots.txt ;-)


            Amicalement,



            PhilJ
            Dernière édition par PhilJ à 15/07/2014, 01h50
            Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

            Commentaire


            • #96
              Re : Comprendre comment Google &quot;voit&quot; mon site

              Tss tss réfléchissons un peu !

              La structure de 1and1 est ce qu'elle est et on n'y peut rien à part peut être :
              Hum. Moi je sais bien ce que je déplacerais si j'étais toi. Ce ne serait pas seulement un fichier...
              Où est donc le site root : réponse logique là où pointe http://monsiteàmoi.fr
              et que physiquement ça ne corresponde pas à la racine des fichiers physiques chez 1and1 n'entre absolument pas en ligne de compte. Deux choses à ce propos:
              1) si je remonte le robots.txt à la racine physique de 1and1, comment Google le trouve , hmmm ? il serait 'au-dessus' de www/monsiteamoi.fr et donc inaccessible par le web ...

              2) J'ai cinq sites différents (c'est au moins ça pour Flo qui garde effectivement des douzaines de vieilleries (pardon de rougeries !) ), je veux (évidemment) un robots.txt pour chacun de mes sites, si je les mets à la racine physique de 1and1 (celle de mon compte ne tout cas), je fais comment ? je les empile ? je les appelle robots1, robots2 etc etc


              Tes fichiers sont bien où ils sont n'y touche pas !


              C'est pas pour dire, mais je suis sûr que tu aurais monté toutes tes vieilleries comme dit philJ, sur un site local, tu te serais même pas posé la question, comme quoi local ou distant, si la question se pose, c'est pas tout à fait dans les termes que la posait philJ et n'est en tout cas pas aussi simple qu'il parait pour une personne 'normale' (je veux dire pas un ou une malade du web comme moi ou philJ)
              Dernière édition par PieceOfCake à 15/07/2014, 06h21
              Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

              Commentaire


              • #97
                Re : Comprendre comment Google &quot;voit&quot; mon site

                @pieceofcake :
                oui j ai mal compris ce qui se passe dans le cadre de ce post....
                Cela m arrives de temps en temps, quand l orage fait sauter les plombs de chez moi et que je me retrouves sans cafeine.

                je me trompes donc en pensant que le fait d utiliser lattribut rel=canonical sur un lien fait que les autres liens situés sur d autres domaines sont automatiquement considérés comme des contenus dupliqués, vu que l url d origine est celle qui contient cet attribut.....

                sinon on tente de battre le record de la plus longue réponse à une question? vu qu on est deja ben parti...
                @flodariege

                La racine de ton site est la ou pointes ton nom de domaine.

                Bouger ce fichier serait valable si on accédait a ton site en entrant dans la barre d adresse :
                http://monsite.fr/sous-domaine.
                or ce n est pas le cas....
                Dernière édition par lefabdu51 à 15/07/2014, 10h04

                Commentaire


                • #98
                  Re : Comprendre comment Google &quot;voit&quot; mon site

                  je me trompes donc en pensant que le fait d utiliser lattribut rel=canonical sur un lien fait que les autres liens situés sur d autres domaines sont automatiquement considérés comme des contenus dupliqués, vu que l url d origine est celle qui contient cet attribut.....
                  Non tu ne te trompes pas, mais ce n'est pas le cas présent ni l'objet.

                  As tu ouvert le lien dans ma réponse, lien provenant de Mr Google lui-même expliquant l'utilisation (courante) de rel=canonical, notamment pour les CMS dans l'objectif de régler les cas de duplicate content provenant des liens multiples sur le même document physique.

                  Dans le cas que tu énonces, il y a plusieurs documents physique identiques sur un ou des sites différents.
                  Dans le cas dont nous parlons il y a un ou plusieurs liens différents pointant sur un seul et même document physique.

                  Dans le cas présent, je me pose des questions quand a son utilité.
                  Regarde le lien que j'ai fourni précédemment et que je te redonne pour t'éviter de le rechercher : https://support.google.com/webmaster...r/139066?hl=fr

                  et cette réponse est parfaitement en adéquation avec la question : Comment Google 'voit' mon site ?
                  Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                  Commentaire


                  • #99
                    Re : Comprendre comment Google &quot;voit&quot; mon site

                    oui je l ais lu....et comme je l ais dit, j ai mal compris dans ce cas précis.....excusez moi monsieur pour cela....
                    Ce lien figures dans mes favoris, je l ais ajouté....il me sera utile si je constate ce type de dysfonctionnement.

                    Et j ai fait cet ajout pour information sur le cas le plus courant d'utilisation de cet attribut, pas en application sur ce cas precis. tout comme le message 64 sur l'utilisation du cache...ce sont des infos générales mais qui peuvent aussi servir à d autres.

                    J ai juste oublié de rajouter devant ceci Pour info: .c est ce qui est a la source de l incompréhension entre nous.....désolé pour cet oubli.
                    Dernière édition par lefabdu51 à 15/07/2014, 12h46

                    Commentaire


                    • Re : Comprendre comment Google &quot;voit&quot; mon site

                      excusez moi monsieur pour cela....
                      lol arrête tu me fais pleurer
                      Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                      Commentaire


                      • Re : Comprendre comment Google &quot;voit&quot; mon site

                        lol pleurer de rire j espere..si c est le cas c etait le but on nages entre serieux, reponse aux question de flodariege et grand comique ds cette serie de posts...

                        Commentaire


                        • Re : Comprendre comment Google &quot;voit&quot; mon site

                          Envoyé par PieceOfCake Voir le message
                          As tu ouvert le lien dans ma réponse, lien provenant de Mr Google lui-même expliquant l'utilisation (courante) de rel=canonical, notamment pour les CMS dans l'objectif de régler les cas de duplicate content provenant des liens multiples sur le même document physique.
                          Bon ben moi je l'ai lu le 'mode d'emploi' Google, et j'adorerais être capable de mettre en places ces URL canoniques (ça m'éviterait un boulot monstre d'architecture, abattage de cloisons et remise en peinture des murs de mon site, mais si je t'ai bien suivi dans tes précédents posts, il n'y a aucune extension qui sache le faire sans provoquer d'erreur, et Joomla lui même se plante 1 fois sur 4.
                          Moralité ? J'oublie, et je sors le marteau piqueur et la masse ?

                          (et merci pour les précisions sur le robots.txt, nickel , merci 10101010101010101010101010101010101010101010101010 101010101010* fois)

                          (en mode binaire, ça fait combien ??? )

                          Bonne nuit tout le monde !
                          Flo, Ariège

                          Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                          Commentaire


                          • Re : Comprendre comment Google &quot;voit&quot; mon site

                            Envoyé par FlodAriege Voir le message
                            Bon ben moi je l'ai lu le 'mode d'emploi' Google, et j'adorerais être capable de mettre en places ces URL canoniques (ça m'éviterait un boulot monstre d'architecture, abattage de cloisons et remise en peinture des murs de mon site, mais si je t'ai bien suivi dans tes précédents posts, il n'y a aucune extension qui sache le faire sans provoquer d'erreur, et Joomla lui même se plante 1 fois sur 4.
                            Moralité ? J'oublie, et je sors le marteau piqueur et la masse ?

                            (et merci pour les précisions sur le robots.txt, nickel , merci 10101010101010101010101010101010101010101010101010 101010101010* fois)

                            (en mode binaire, ça fait combien ??? )

                            Bonne nuit tout le monde !
                            Si : il y a actuellement une solution (j'expérimente dessus actuellement)mais elle passe par la mise en place manuelle de la balise rel=canonical à l'ancienne (à la main si tu préfères au cas par cas dès que je serais satisfait de ce que j'ai fait, je communiquerai dessus

                            Cordialement
                            Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                            Commentaire


                            • Re : Comprendre comment Google &quot;voit&quot; mon site

                              Salut à toi PieceOfCake

                              Ta solution m'intéresse d'autant plus que je viens de me rendre compte (oui je sais, je suis longue à la détente) que le plus gros de mes contenus dupliqués étaient sans rapport avec mes liens de menu de 1er niveau blog de catégorie (ceux que je suis en train de remplacer, en local, par de simples séparateurs) :
                              Ce sont les URL générées par FC pour afficher le résultat d'un clic sur le lien "dans la même catégorie".
                              Je trouverais fort dommage de devoir se priver de ce type de fonctionnalité juste parce que les moteurs prennent ça pour du contenu dupliqué…
                              Je n'ai listé que les URL "normales" dans mon sitemap (ce que suggère d'ailleurs Google dans l'article que tu as partagé avec nous), mais visiblement ça ne suffit pas.
                              Ceci dit je ne trouve ces URL dans les SERP que lorsque je fais une recherche de type site:www.monsite.fr Je ne pense pas que ça change grand chose mais bon.
                              Bref, ta solution manuelle m'intéresse fortement
                              Allez, bonne journée et @ bientôt.


                              Sent from my iPhone using Forum Joomla.fr mobile app
                              Flo, Ariège

                              Il n'y a que celui qui a honte d'apprendre qui a peur de demander

                              Commentaire


                              • Re : Comprendre comment Google &quot;voit&quot; mon site

                                10101010101010101010101010101010101010101010101010 101010101010* fois)

                                (en mode binaire, ça fait combien ??? )
                                facile. en mode binaire ça fait très exactement :
                                10101010101010101010101010101010101010101010101010 101010101010


                                en décimal je vais prendre un peu de temps (j'ai que dix doigts et ça va pas suffire )
                                Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                                Commentaire

                                Annonce

                                Réduire
                                Aucune annonce pour le moment.

                                Partenaire de l'association

                                Réduire

                                Hébergeur Web PlanetHoster
                                Travaille ...
                                X