Nous avons 3 pages de produits dans lesquelles nous avons ajouté des liens internes (liens PDF), le rapport d'analyse de la console de recherche Google affiche une erreur intitulée "URL soumise non sélectionnée comme canon".
Le PDF est un guide d'instructions commun à presque tous les éléments du site Web. Comment surmonter ce problème dans la console de recherche Google?
Si le contenu PDF est trop similaire à votre contenu HTML, vous pouvez empêcher Google d'explorer ces pages en ajoutant rel = "nofollow" à vos liens pointant vers les fichiers PDF.
Je pense que vous pouvez également empêcher Google d'explorer ces pages en ajoutant PDF comme paramètre ici https://www.google.com/webmasters/tools/crawl-url-parameters?hl= en & siteUrl =
Vous pouvez également modifier l'en-tête http pour les fichiers PDF en canoniques. Voici une méthode:
Vous pouvez également écrire l'en-tête canonique dans PHP et appeler le fichier PDF:
Vous pouvez en apprendre plus à ce sujet ici:
https://moz.com/blog/how-to-advanced-relcanonical-http-headers
La principale exigence pour une implémentation propre et automatique est que vos fichiers pdf portent les mêmes noms de fichiers que leurs pages html correspondantes, à savoir:
Une fois que vous avez cette structure dans vos noms de fichiers, vous ajoutez quelque chose comme suit à votre htaccess pour ajouter à tous les fichiers pdf le lien canonique vers le fichier HTML correspondant:
RewriteRule ([^/]+)\.pdf$ - [E=FILENAME:$1] <FilesMatch "\.pdf$"> Header add Link "< https://example.com/%{FILENAME}e.html >;rel=\"canonical\"" </FilesMatch>