Problème de sur-indexation de pages par Google

Réduire
X
 
  • Filtrer
  • Heure
  • Afficher
Tout effacer
nouveaux messages

  • Problème de sur-indexation de pages par Google

    Bonjour,

    Je bosse actuellement sur le site suivant : http://www.hosteam.fr/ (Joomla! 2.5.9)

    Le problème que je rencontre provient d'une sur-indexation du nombre de page dans Google.
    Plus de 950 pages sont indéxées sur Google alors qu'il est sensé en exister seulement 86 (selon le sitemap).
    (75 pages sont indéxées sur Bing à titre de contre exemple, ce qui paraît normal.)

    Concernant les potentielles solutions que j'ai lues auparavant, elles sont déjà en place sur le site.
    Exemple :
    Fichier robots.txt : présence de Disallow: /administrator/
    Sitemap : en règle, donc a priori pas de pb ici

    Chose étrange, je retrouve dans les SERP des url contenant la racine "component" : http://www.hosteam.fr/component/content/index.php?option=com_content&view=article&id=71&It emid=423
    Or dans le fichier robots.txt, Disallow: /component/ est bien présent...

    Hormis le fait de supprimer manuellement les url via GWMT (900 url qd même...), quelqu'un a-t-il trouvé une solution à ce problème ou une raison qui pourrait l'expliquer ?

    Je m'hasarderais bien a dire que quelque chose (un module ?) duplique des url depuis la backoffice, mais n'étant assez calé sur Joomla, j'aimerai bien l'avis d'experts

    Merci à tous pour votre aide,
    Nicolas

  • #2
    Re : Problème de sur-indexation de pages par Google

    Bonjour

    Envoyé par Nicolas M Voir le message
    Fichier robots.txt : présence de Disallow: /administrator/
    /administrator = un dossier à la racine de ton site.

    Envoyé par Nicolas M Voir le message
    Or dans le fichier robots.txt, Disallow: /component/ est bien présent..
    /component = n'est pas un dossier. C'est le résultat de la réécriture des urls par Joomla. Logique donc que le fichier robots.txt soit inutile ici.

    Pour ta question de base, il devrait être possible de faire ce type de manoeuvre avec deux/trois lignes dans .htaccess mais cela me semble être la méthode tordue d'y arriver.

    Si personne n'a d'autres astuces à te proposer, sache qu'il est possible de définir un
    Code:
    Header set X-Robots-Tag "noindex, noarchive"
    dans .htaccess. Généralement on fait cela en fonction du type de fichier (.ppt, .doc, .xls, ...). Tu devrais chercher la règle pour faire cela en fonction de l'url. Mais je pense que c'est la méthode tordue d'y arriver.

    Bonne journée.
    Christophe (cavo789)
    Mon blog, on y parle Docker, PHP, WSL, Markdown et plein d'autres choses : https://www.avonture.be
    Logiciel gratuit de scan antivirus : https://github.com/cavo789/aesecure_quickscan (plus de 45.000 virus détectés, 700.000 fichiers sur liste blanche)​

    Commentaire


    • #3
      Re : Problème de sur-indexation de pages par Google

      Ok,

      Merci pour ta réponse cavo789.

      Je vais voir via le htaccess.

      Si d'autres solutions connues, je suis preneur bien sûr.

      Bonne journée,
      Nicolas

      Commentaire


      • #4
        Re : Problème de sur-indexation de pages par Google

        Oui je pense qu'il y a une autre solution, puisque tu ne constates le problème qu'avec Google et pas avec Bing par exemple, tu peux avec GWT, lui demander de ne pas explorer ou d'éviter ou de court-circuiter, les urls qui contiennent certains paramètres (comme option= par exemple).

        Cela se fait dans GWR en allant paramétrer comme il convient les rubriques du menu : Exploration > Paramètres d'url.

        Le titre de la rubrique dit déjà bien ce qu'il veut dire et le sous-titre : "Aidez le moteur Google à explorer votre site plus efficacement en indiquant la manière dont nous devons traiter les paramètres dans vos URL" est encore plus explicite

        Prend le temps de bien lire la documentation en ligne, pour ne pas faire plus de mal que de bien (tout ce que tu risques, c'est que certaines url ne soient plus traiter et que Google 'oublie' des pages de ton site, donc une modification à la fois et beaucoup de surveillance après coup)!

        Bon courage
        Il y a 10 sortes de gens. Ceux qui savent compter en binaire et ceux qui ne savent pas ...

        Commentaire

        Annonce

        Réduire
        Aucune annonce pour le moment.

        Partenaire de l'association

        Réduire

        Hébergeur Web PlanetHoster
        Travaille ...
        X