Le site Web sur lequel je travaille contient quelques centaines de PDF. Je ne pense pas avoir jamais vu aucun d'entre eux revenir dans une recherche, mais il y a des liens vers directement à partir du site. Ils sont également pleins de mots-clés car ce sont des documents de produit.
Y a-t-il quelque chose de spécial à faire pour que Google ou d'autres moteurs de recherche les explorent?
Existe-t-il des règles strictes pour la création de PDF permettant à Google de les aimer davantage? Par exemple, devrais-je les exécuter via ghostscript pour nettoyer les balises PDF brisées que Adobe a créées lors de la génération?
Google indexe définitivement PDF fichiers et vous pouvez simplement rechercher des fichiers PDF en ajoutant filetype:pdf
à votre requête de recherche ( exemple ).
Je dirais que les principales choses à faire pour optimiser un PDF afin qu'il soit facilement indexé sont les suivantes:
Pour plus de conseils, lisez Optimisation PDF Documents et Onze conseils pour optimiser les fichiers PDF sur les moteurs de recherche
Je ne suis pas sûr des autres moteurs de recherche, mais pour Google, la règle principale serait de ne pas les exclure via robots.txt.
This était leur première annonce de prise en charge de la recherche PDF.
Tout comme rendre votre site Web compatible ne peut pas nuire à votre référencement, rendre votre PDF accessible ne peut pas nuire. Le vérificateur d'accessibilité intégré d'Adobe est loin d'être parfait, mais au moins la réparation de ces zones vous permettra de commencer.
Je passe probablement 5 minutes sur chaque 4 ou 5, principalement des PDF au format texte que nous mettons en ligne. Le temps augmente uniformément en fonction du nombre de pages et de la complexité de ces pages.
En supposant que vous ayez Adobe Acrobat Pro pour effectuer vos modifications:
Pour l'édition plus avancée comme les tableaux et les erreurs vraiment bizarres d'Adobe, nous utilisons un plugin appelé CommonLook. CommonLook fait le travail, mais je le déteste presque autant que les outils Adobe.
Familiarisez-vous avec l'outil Retoucher l'ordre de lecture, la barre d'outils Tags, la barre d'outils Ordre de lecture et la barre d'outils Contenu. Mon travail nécessite des documents entièrement conformes avant de pouvoir être utilisés sur le Web, mais tout le monde pourrait tirer parti de simples balises et propriétés de document.