Bonjour,
J'ai vu avec stupeur que la page d'accueil du site https://www.onsort.eu/fr/ (ndd plusieurs années et refais en début d'année avec joomla à la place de wp) n'était pas indexé en mettant "onsort.eu" dans le moteur de recherche google. En allant dans la console GG , je n'arrive pas à la faire réindexer. C'est là que je me suis aperçu qu'il y avait des milliers d'urls (probablement ancien site) dans la colonne url exclue car "Anomalie lors de l'exploration" dont la page d'accueil du site (cela fait mauvais genre!). Toutes en dehors de quelques bonnes urls actuelles donnent une erreur 404.
J'ai vu qu'il fallait absolument enlever ces urls avec erreur 404 car Google ne le faisait pas naturellement.
Les pages exclues et que les urls (image) sont :
* essentiellement du spam
* anciennes urls wordpress qui avait une faille
aucunes n'ony leur place dans l'index.
* quelques urls correctes dont la racine du site :-(
Je pense avoir une solution qui va m'éviter de déprimer trop rapidement. A cette heure, je n'ai pas eu de réponse dans une discussion sur WebrankInfo et il semble que le cas soit difficile, les actions pouvant aggraver la situation et le temps de prise en compte assez long Du coup j'aurai besoin que des "experts SEO" valident la méthode proposée (pour que je n'aggrave pas la situation) voir en la détaillant. Pas sûr que des extensions mefacilitent le travail mais si c'est le cas (je pensai à sh404SEF ou autres) merci de me l'inidquer. Le pus important étant de valider ce qui suit:
Etape 1
je récupère les urls exclues à partir de la console GG dans un fichier csv
Etape 2
je fais le ménage en enlevant les bonnes urls dont celle de la page accueil
Etape 3
Je mets la liste de ces urls et je crée une page cachée sur le site ou un sitemap renvoyée à GG
Etape 4
Je dois faire un redirectpermannt 410 de cette même liste (c'est là ou je ne sais pas si c'est obligatoire, vivement conseillé ...)
J'ai vu aussi ici et ailleurs l'idée de réinjecter ces urls (en enlevant les bonnes urls code 200 bien sûr) dans un sitemap et le soumettre à Google.
J'ai compris que l'article que je cite n'est plus actualisé. néanmoins la question maintenant c'est si c'est obligatoire ou fortement conseillé de remplir le htaccess avec toutes ces urls avec un redirect 410 !?
réponse aux questions daneel par ailleurs:
redirections avec le composant ou le fichier htaccess: Non
bloqué les tentatives de hack et amélioré la sécurité de ton site (CSP, HSTS...): oui avec extension security check pro
réalisé un plan de site et soumis à google: ben non j'entrais dans la phase de référencement (j'envisage jsitemap)
Bonne journée
{"data-align":"none","data-size":"full","data-attachmentid":2007241}
J'ai vu avec stupeur que la page d'accueil du site https://www.onsort.eu/fr/ (ndd plusieurs années et refais en début d'année avec joomla à la place de wp) n'était pas indexé en mettant "onsort.eu" dans le moteur de recherche google. En allant dans la console GG , je n'arrive pas à la faire réindexer. C'est là que je me suis aperçu qu'il y avait des milliers d'urls (probablement ancien site) dans la colonne url exclue car "Anomalie lors de l'exploration" dont la page d'accueil du site (cela fait mauvais genre!). Toutes en dehors de quelques bonnes urls actuelles donnent une erreur 404.
J'ai vu qu'il fallait absolument enlever ces urls avec erreur 404 car Google ne le faisait pas naturellement.
Les pages exclues et que les urls (image) sont :
* essentiellement du spam
* anciennes urls wordpress qui avait une faille
aucunes n'ony leur place dans l'index.
* quelques urls correctes dont la racine du site :-(
Je pense avoir une solution qui va m'éviter de déprimer trop rapidement. A cette heure, je n'ai pas eu de réponse dans une discussion sur WebrankInfo et il semble que le cas soit difficile, les actions pouvant aggraver la situation et le temps de prise en compte assez long Du coup j'aurai besoin que des "experts SEO" valident la méthode proposée (pour que je n'aggrave pas la situation) voir en la détaillant. Pas sûr que des extensions mefacilitent le travail mais si c'est le cas (je pensai à sh404SEF ou autres) merci de me l'inidquer. Le pus important étant de valider ce qui suit:
Etape 1
je récupère les urls exclues à partir de la console GG dans un fichier csv
Etape 2
je fais le ménage en enlevant les bonnes urls dont celle de la page accueil
Etape 3
Je mets la liste de ces urls et je crée une page cachée sur le site ou un sitemap renvoyée à GG
Etape 4
Je dois faire un redirectpermannt 410 de cette même liste (c'est là ou je ne sais pas si c'est obligatoire, vivement conseillé ...)
J'ai vu aussi ici et ailleurs l'idée de réinjecter ces urls (en enlevant les bonnes urls code 200 bien sûr) dans un sitemap et le soumettre à Google.
J'ai compris que l'article que je cite n'est plus actualisé. néanmoins la question maintenant c'est si c'est obligatoire ou fortement conseillé de remplir le htaccess avec toutes ces urls avec un redirect 410 !?
réponse aux questions daneel par ailleurs:
redirections avec le composant ou le fichier htaccess: Non
bloqué les tentatives de hack et amélioré la sécurité de ton site (CSP, HSTS...): oui avec extension security check pro
réalisé un plan de site et soumis à google: ben non j'entrais dans la phase de référencement (j'envisage jsitemap)
Bonne journée
{"data-align":"none","data-size":"full","data-attachmentid":2007241}
Commentaire