Comprendre comment Google "voit" mon site

Réduire
Ce sujet est fermé.
X
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • #76
    Re : Comprendre comment Google "voit" mon site

    ...Une solution provisoire pourrait dans ce cas résider dans l'utilisation d'une extension répondant au doux nom d'URL canonicalization. Voir ici sur le JED : http://extensions.joomla.org/extensi...onicalization-

    A noter que si on utilise ce genre d'extension, ça ne peut pas être provisoire, puisque leur retrait signifie également le retrait de la balise rel=canonical et génère à nouveau et immédiatement (ou presque) du duplicate content.

    Si quelqu'un essaie 'Canonical Url' que je trouve un peu cher pour mes moyens personnels,sans garantie aucune du résultat, je suis intéressé quand aux conclusions.
    J'ai utilisé Canonical de styleware.eu pendant 3 mois avant de le désactiver, ayant eu quelques soucis avec. (Pour la petite histoire, l’algorithme, essaie de recalculer une url de base qu'il désigne comme canonical (OK : parfait), sauf que l’algorithme est faux pour la page d'accueil, que malgré les questions posées par de nombreuses personnes sur le forum de styleware, il n'y aucune réponse sur ce point, que en outre quand l'algorithme part en quenouille, il ne génère plus rien, sur mon site, ils n'ont trouvé comme solution pour le réparer que de réactiver le cache système plugin (ce qui a effectivement réparé le rel=canonical) et immédiatement (ce qui n'est pas surprenant) semé la zone sur tout le reste du site, les effets de bord de ce plugin étant bien connus.

    Sur le principe le plugin de styleware semble très efficace, seul soucis, il n'y a pas de logs des échecs d'affectations de la génération du rel=canonical et le suivi par le (ou les ?) développeur(s) est véritablement défaillant.

    Personnellement je ne le conseille pas.
    Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

    Commentaire


    • #77
      Re : Comprendre comment Google "voit" mon site

      Elles demandent seulement aux moteurs de recherche (et à eux seuls), de ne pas indexer — ou d'indexer par exception — des fichiers et / ou des dossiers. On ne peut donc définitivement pas compter sur elles pour garder un secret :-\.
      La solution est un fichier très trsè méconnu : le fichier .htaccess .
      Il n y a que lui pour etre efficace.

      Commentaire


      • #78
        Re : Comprendre comment Google "voit" mon site

        Bonsoir à tous

        Je viens de survoller les quelques dernières réponses de cette fort longue discussion.

        Envoyé par PhilJ Voir le message
        Juste une remarque : la méthode très astucieuse expliquée par Christophe consistant à déposer un .htaccess dans le dossier à protéger des « regards » indiscrets (plutôt que d'intervenir dans le robots.txt) ne protège en fait que les pages web — en l'occurrence, si j'ai bien compris, en les modifiant au vol.
        Pas tout à fait : il s'agit d'entêtes envoyées par le serveur et ne dépendent pas du format de fichiers. Ce header est lu et (doit être) interprété par le client (le bot du moteur de recherche ici). Le fait de voir un x-robots-tag "noindex, noarchive" lui dit que la ressource téléchargée (page html, fichier pdf, ...) ne peut pas être reprise dans les résultats du moteur de recherche (ce qu'on nomme les SERPs).

        Envoyé par PhilJ Voir le message
        => Quelqu'un aurait-il une technique à proposer aussi intéressante que celle mentionnée par Christophe pour protéger à la fois efficacement et discrètement les documents autres que HTML dans tout un dossier donné ?
        Toujours notre fichier .htaccess; celui à la racine de ton site cette-fois :

        Code:
        <FilesMatch "\.(pdf|zip)$">
         <IfModule mod_headers.c>
          Header set X-Robots-Tag "noindex, noarchive"
         </IfModule>
        </FilesMatch>
        J'ai mis pdf et zip pour illustrer comment on peut mettre plus d'une extension de fichier.

        (pour info, cette sécurité est mise en place par aeSecure; option 2.5)

        Dès lors que le bot va voir un lien vers un fichier PDF de ton site et qu'il suivra le lien, il va donc lancer une requête vers ton site avec une url se terminant par .pdf. Cette url sera traitée par le code .htaccess ci-dessous qui va envoyer une entête noindex, noarchive.

        Le bot aura donc téléchargé le fichier mais tu lui auras expréssement interdit de le mentionner dans ses SERPS.

        C'est ce que tu souhaitais faire :-)

        Bonne soirée à tous / toutes.
        Christophe (cavo789)
        Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
        Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

        Commentaire


        • #79
          Re : Comprendre comment Google &quot;voit&quot; mon site

          Envoyé par FlodAriege Voir le message
          'a'y'est, c'est fait
          Bon maintenant faut attendre que Google s'en rende compte...
          ..Et zou, c'est fait (10-07-2014). Le site est maintenant en haut de la première page pour la requête 'économies d'énergie ariège' . Luxe : une illustration est utilisée dans la colonne de droite quand on survole le lien.

          Le site est bien visible aussi pour 'chauffage ariège' dès la première page des SERP.

          C'est un bon début.
          Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

          Commentaire


          • #80
            Re : Comprendre comment Google &quot;voit&quot; mon site

            Bonjour,


            Envoyé par cavo789 Voir le message
            Code:
            <FilesMatch "\.(pdf|zip)$">
             <IfModule mod_headers.c>
              Header set X-Robots-Tag "noindex, noarchive"
             </IfModule>
            </FilesMatch>
            ...Merci Christophe.

            Je n'ai pas testé ce code, mais à ce que je comprends, étant placé à la racine du site, il demande de ne pas indexer les fichiers PDF et ZIP de tout le site. Comment faire pour que les moteurs n'indexent pas les PDF & ZIP d'un dossier spécifique ? Déposer ce code dans un .htaccess du dossier à protéger ?
            Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

            Commentaire


            • #81
              Re : Comprendre comment Google &quot;voit&quot; mon site

              Bonjour,


              Envoyé par PieceOfCake Voir le message
              A noter que si on utilise ce genre d'extension, ça ne peut pas être provisoire, puisque leur retrait signifie également le retrait de la balise rel=canonical et génère à nouveau et immédiatement (ou presque) du duplicate content.
              ...L'idée (suggérée par Florence) était de temporiser, afin de préparer tranquillement une version « clean » du site en coulisses. Ensuite, on désactiverait « la chose » lorsque tout serait prêt pour guider les moteurs de recherche avec une architecture plus claire et plus efficace assaisonnée de redirections adéquates.

              Mais :

              J'ai utilisé Canonical de styleware.eu pendant 3 mois avant de le désactiver, ayant eu quelques soucis avec.
              ...Ma chère Florence, si ce que dit le camarade PieceOfCake est vrai (et il ne dit pas que des sottises, il en dit même moins que moi ), cela signifierait qu'il ne vaudrait pas vraiment (ou même vraiment pas) la peine de passer par la case 'URL canonicalization', mais plutôt qu'il serait préférable de se lancer dans les modifications de structure suggérées sans disperser son énergie (<= c'est le mot ). Bon, c'est vrai, l'eau est un peu fraîche au début, mais on s'habitue assez vite :-)

              Si nécessaire, installer au-dessus de soi quelques panneaux photovoltaïques de bonne dimension (vu que le fond de l'air est fraîche).

              Du coup, en résumé, ce qui gagnerait à être changé dans le menu principal, et cela sans passer par des étapes du genre redirection d'URL et / ou définition des URL canoniques :
              • Raccourcir les alias. Par exemple, /index.php/nos-specialites-nos-solutions-economies-d-energie/nos-solutions-chauffage-basse-consommation gagnerait à devenir /index.php/economies-d-energie/chauffage-basse-consommation, ou même /economies-d-energie/chauffage-basse-consommation en faisant l'économie du très inutile /index.php. Gain : 44 caractères dans le premier cas, 54 caractères dans le second cas (soit ~ deux fois moins long que maintenant, et avec uniquement des mots-clés bien adaptés et très significatifs = rien que du bon ).
              • Éliminer définitivement le contenu dupliqué :
                • en supprimant les liens de premier niveau (= 'A propos', 'Nos solutions'...) qui sont de type 'blog de catégorie', et en les remplaçant par des liens de type séparateurs.
                • en insérant à leur place un nouveau lien de deuxième niveau servant de table d'orientation (à faire avec Joomla ou ton CCk — ou un autre CCK).

              • Mettre en place les redirections utiles pour que Google & co n'y voient que du feu.



              Évidemment, il faut commencer par tester tout cela en toute discrétion, en local ou sur un sous-domaine privé.


              Amicalement,



              PhilJ
              Dernière édition par PhilJ à 10/07/2014, 16h22
              Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

              Commentaire


              • #82
                Re : Comprendre comment Google &quot;voit&quot; mon site

                Envoyé par PhilJ Voir le message
                il demande de ne pas indexer les fichiers PDF et ZIP de tout le site. Comment faire pour que les moteurs n'indexent pas les PDF & ZIP d'un dossier spécifique ? Déposer ce code dans un .htaccess du dossier à protéger ?
                Yep ! et re-yep ! Tu n'as qu'à le mettre dans le dossier à protéger; that's all.

                Reste que nous sommes bien tous d'accord : nous demandons aux gentils moteurs de recherche de ne pas indexer. Les méchants (ou les idiots) ne vont pas comprendre notre demande.
                Christophe (cavo789)
                Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
                Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

                Commentaire


                • #83
                  Re : Comprendre comment Google &quot;voit&quot; mon site

                  Envoyé par cavo789 Voir le message
                  Yep ! et re-yep ! Tu n'as qu'à le mettre dans le dossier à protéger; that's all.
                  ...Thanks. Well done :-)


                  Reste que nous sommes bien tous d'accord : nous demandons aux gentils moteurs de recherche de ne pas indexer. Les méchants (ou les idiots) ne vont pas comprendre notre demande.
                  Zut, et mes fichiers top secret défense à n'ouvrir qu'en cas de menace de guerre nucléaire, je les cache où donc alors ?

                  ...Idée : fermés à clé dans le tiroir de mon bureau et je jette la clé le plus loin possible dans le jardin.
                  Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                  Commentaire


                  • #84
                    Re : Comprendre comment Google &quot;voit&quot; mon site

                    Avec le nombre de chefs multi-étoilés qui sont intervenus dans cette discussion, ce n'est pas surprenant que j'y ai puisé une quantité de recettes pour mieux cuisiner Joomla :
                    • mise au rebut d'index.php,
                    • utilisation de robots.txt,
                    • intérêt discutable du cache,
                    • architecture avec les liens séparateur et K2,
                    • emploi d'un sous-domaine (± caché) pour conduire des essais en ligne et non en local,
                    • dimensionnement et choix des mots pour les alias et le nom du site

                    c'est un véritable MOOC ! Merci à tous ces professeurs de l'université Joomla !

                    Et en prime tout cela est clair et plein d'humour, de légèreté … et vous attire l'admiration d'un … marmiton Joomla !
                    Dernière édition par PhMi à 11/07/2014, 15h10
                    Dans le chaos du compliqué, trouver la solution simple qui n'est pas simpliste, car elle permet le complexe !
                    https://www.pensees-vagabondes.fr
                    https://www.markagement.com

                    Commentaire


                    • #85
                      Re : Comprendre comment Google &quot;voit&quot; mon site

                      Envoyé par PhMi Voir le message
                      Avec le nombre de chefs multi-étoilés qui sont intervenus dans cette discussion [...]
                      ...Bah ! N'exagérons rien .


                      architecture avec les liens séparateur et K2
                      ...Oui, K2 doit bien convenir aussi. Mais avec un peu d'astuce (utilisation de modules) on peut aussi s'en dispenser, comme il l'a été dit, et oeuvrer uniquement avec notre ami Joomla. Personnellement, dès que la structure prend un peu d'ampleur ( > 8 pages) et qu'elle propose des produits ou services, je préconise DJ-Catalog2, qui est à la fois puissant et simple d'emploi.


                      [...] en prime tout cela est clair et plein d'humour, de légèreté … et vous attire l'admiration d'un … marmiton Joomla !
                      ...Il est certain que sourire ne coûte pas bien cher. Et c'est souvent efficace dans la communication .


                      => A bientôt pour d'autres recettes croquantes et gourmandes .



                      Cordialement,



                      PhilJ


                      PS : qui s'y colle, ce week-end, pour faire la vaisselle ?
                      Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                      Commentaire


                      • #86
                        Re : Comprendre comment Google &quot;voit&quot; mon site

                        Envoyé par PhMi Voir le message
                        [*]emploi d'un sous-domaine (± caché) pour conduire des essais en ligne et non en local,
                        Ca c'est peut être plus discutable, je meurs d'envie de démarrer une polémique mais il nous faudrait ouvrir un autre tome, parce que la on va éclater le nombre de pages autorisés dans un roman de bonne facture
                        Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                        Commentaire


                        • #87
                          Re : Comprendre comment Google &quot;voit&quot; mon site

                          PhilJ , je ne suis pas un flatteur, mais un gourmet. Chercheur de formation (il y a très longtemps), vous avez excité ma curiosité.

                          J'ai déjà dégusté Virtuemart, Gantry, Kunema … je sens que je vais goûter à K3 ou DJ-Catalog2.

                          PieceOfCake, j'ai rencontré suffisament de problème de transfert de local à OVH, pour être tenté par l'utilisation de sites d'essai en ligne. Par contre, je rapatrie en local des sauvegardes … en particulier pour vérifier qu'elle est bonne.

                          Mais nous sommes bien loin du titre de cette discussion … So long.
                          Dans le chaos du compliqué, trouver la solution simple qui n'est pas simpliste, car elle permet le complexe !
                          https://www.pensees-vagabondes.fr
                          https://www.markagement.com

                          Commentaire


                          • #88
                            Re : Comprendre comment Google &quot;voit&quot; mon site

                            Bonjour,

                            Envoyé par PieceOfCake Voir le message
                            Ca c'est peut être plus discutable, je meurs d'envie de démarrer une polémique mais il nous faudrait ouvrir un autre tome, parce que la on va éclater le nombre de pages autorisés dans un roman de bonne facture
                            Monsieur,


                            Je jette mon gant à vos pieds (les canons de l'élégance me dictant de ne point en faire usage pour vous gifler). Retrouvons-nous donc, à armes égales, sur le champ clos de votre choix, à 5 heures demain matin. Euh.. disons plutôt vers midi, ou même en soirée .

                            A vous le choix du terrain sur forum.joomla.fr.


                            PS : Je l'aurai, un jour, je l'aurai
                            Créateur de sites internet — Agence web indépendante http://www.e-33.fr | http://www.quali-site.fr (région de Bordeaux)

                            Commentaire


                            • #89
                              Re : Comprendre comment Google &quot;voit&quot; mon site

                              Si vous avez besoin d'un témoin … en tous cas, je suivrai les passes d'armes, si vous m'invitez !
                              Dans le chaos du compliqué, trouver la solution simple qui n'est pas simpliste, car elle permet le complexe !
                              https://www.pensees-vagabondes.fr
                              https://www.markagement.com

                              Commentaire


                              • #90
                                Re : Comprendre comment Google &quot;voit&quot; mon site

                                Envoyé par PhilJ Voir le message
                                Bonjour,



                                Monsieur,


                                Je jette mon gant à vos pieds (les canons de l'élégance me dictant de ne point en faire usage pour vous gifler). Retrouvons-nous donc, à armes égales, sur le champ clos de votre choix, à 5 heures demain matin. Euh.. disons plutôt vers midi, ou même en soirée .

                                A vous le choix du terrain sur forum.joomla.fr.


                                PS : Je l'aurai, un jour, je l'aurai

                                lol si tu me lances un défi tu vas pas être déçu
                                on va attendre la fin du week-end histoire de pas gâcher la fête non ?
                                Ce serait dommage que ce soit nous qui tirions le feu d'artifice
                                Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

                                Commentaire

                                Annonce

                                Réduire
                                Aucune annonce pour le moment.

                                Partenaire de l'association

                                Réduire

                                Hébergeur Web PlanetHoster
                                Travaille ...
                                X