web-dev-qa-db-fra.com

Mots-clés PDF sur un site Web et recherche de fichiers PDF en interne à l'aide d'un moteur de recherche

Donc, on m'a demandé de faire plusieurs choses sur mon expérience de travail. Il existe actuellement des fichiers PDF téléchargés sur le site Web de la société. Ce sont des dépannages et les documents techniques/de publication sont intitulés en fonction du sujet principal de leur sujet (comme "Construire une requête". Cependant, ces documents ont tendance à mentionner ou à couvrir un autre sujet avec le principal, comme "Exécuter une requête". Question'.

Mes tâches sont:

  1. Ajoutez des mots-clés ou des balises à ces PDF composés des rubriques abordées dans chaque PDF.
  2. Ajoutez une sorte de moteur de recherche ou un utilitaire similaire à partir duquel un utilisateur pourrait rechercher "x" et voir tous les PDF mentionnant "x".

Je pars de zéro, toutes les idées sont les bienvenues.

2
Ross Massie

Si vous partez de zéro, Wordpress dispose de nombreux plug-ins disponibles qui vous permettront de démarrer rapidement ... voici un exemple pour PDF recherche https: // searchwp.com

Bien que je n'aie pas utilisé ce plugin, il semble avoir les fonctionnalités souhaitées.

Si vous êtes nouveau sur wordpress, vous avez un peu de courbe d'apprentissage, mais il existe de nombreuses ressources et de superbes thèmes disponibles à des endroits tels que themeforest.net.

J'espère que cela pourra aider;)

1
WebStudio

Google vous permet également de créer une recherche sur un seul site Web. Vous pouvez créer un lien hypertexte (lien) dans un document qui permettrait d’afficher une recherche, par exemple:

https://www.google.com/advanced_search?q=site:stackexchange.com+filetype:pdf&lr=&hl=fr&as_qdr=all

Google fournit également un moteur de recherche personnalisé qui implique l'ajout d'une petite quantité de code sur le site Web de la société, ce qui est assez simple à faire.

Cela fait apparaître la zone de recherche avancée de Google avec le site Web déjà défini sur stackexchange.com et le type de fichier défini sur pdf. Adobe.com peut également fournir davantage d'informations, car ce sont les créateurs d'Adobe Acrobat qui créent les fichiers pdf. Dans Adobe Acrobat - la version complète n'est pas le lecteur - vous pouvez définir les propriétés et les mots-clés de chaque fichier. Les autres PDF rédacteurs devraient vous laisser faire de même.

Si les PDF sont des images numérisées de documents écrits de type écrivain (ou de photos évidentes d’imprimés) plutôt que de textes modifiables, vous pouvez utiliser la fonction de reconnaissance optique de caractères (OCR) du logiciel pour que le texte reconnu électroniquement soit prêt à la recherche.

0
Mousey