web-dev-qa-db-fra.com

Comment lier PDF et PS pour une meilleure indexation tout en maintenant une conception correcte?

Supposons que vous avez une seule page Web avec plusieurs liens vers vos articles:

...

Liste des auteurs 1, titre de l'article 1 [PDF] [PS], lieu de publication 1, année 1

Liste des auteurs 2, titre de l'article 2 [PDF] [PS] [DVI], lieu de publication 2, année 2

Liste des auteurs 3, titre de l'article [PDF] [PS], lieu de publication 3, année 3

...

avec des versions liées PS/PDF/DVI de vos documents.

Je souhaite savoir comment optimiser cette structure par rapport aux moteurs de recherche standard (Google, Bing, Yahoo, ...). Ma tentative actuelle est:

<ul>
<li>Author list 1, <i>Paper Title 1</i> <span style="font-size:smaller">[<a href="filename1.pdf" title="Paper Title 1">PDF</a>] [<a href="filename1.ps" title="Paper Title 1">PS</a>]</span>, publication venue 1, year 1</li>
<li>Author list 2, <i>Paper Title 2</i> <span style="font-size:smaller">[<a href="filename2.pdf" title="Paper Title 2">PDF</a>] [<a href="filename2.ps" title="Paper Title 2">PS</a>] [<a href="filename2.dvi" title="Paper Title 2">DVI</a>]</span>, publication venue 2, year 2</li>
<li>Author list 3, <i>Paper Title 3</i> <span style="font-size:smaller">[<a href="filename3.pdf" title="Paper Title 3">PDF</a>] [<a href="filename3.ps" title="Paper Title 3">PS</a>]</span>, publication venue 3, year 3</li>
</ul>

Cette approche pourrait être problématique. Premièrement, les fichiers peuvent être indexés sous "PDF", "PS" ou "DVI", mais pas pendant la recherche de "Titre de papier n". Est-ce vrai? Deuxièmement, la valeur de l'attribut title est-elle réellement respectée par les moteurs de recherche aux fins de l'indexation? J'ai lu quelque part que les moteurs de recherche utilisent le titre uniquement à des fins d'affichage. Troisièmement, si deux ou trois ancres ont le même titre mais des cibles légèrement différentes, les moteurs de recherche considéreraient-ils le site comme un site de publicité?

Pour la seule page Web en question (avec 20 références papier du type ci-dessus), j’ai tous les droits (ajouter, modifier, supprimer) de gérer le répertoire contenant le fichier HTML. Je n'ai pas de droits d'administrateur pour le serveur Web. Toute suggestion d'amélioration est la bienvenue. Mon objectif est que la page Web paraisse agréable et que les moteurs de recherche Web standard (Google, Bing, Yahoo, ...) indexent correctement tous les documents (avec un bon classement si possible) et les associent aux titres correspondants. Les références sont les bienvenues.

1
user71872

Vous voudrez peut-être aborder cette question sous un angle différent si l'objectif est que Google/Bing et d'autres moteurs de recherche indexent les fichiers individuels afin qu'ils apparaissent dans les résultats de recherche et contribuent à dynamiser le référencement de votre site.

Avoir des hyperliens vers les fichiers peut aider, mais vous pouvez probablement obtenir plus d'attention en:

  1. y compris un balisage de schéma valide autour de chaque fichier. Voir http://schema.org/docs/gs.html Voir les types de schéma disponibles.
  2. enregistrer les fichiers avec métadonnées lorsque cela est possible. Pour les fichiers PDF créés dans Acrobat, voir: https://helpx.Adobe.com/acrobat/using/pdf-properties-metadata.html La plupart des documents/fichiers peuvent se voir attribuer des métadonnées à partir des "propriétés". option dans l'application utilisée pour les créer. Ceci est non seulement utile pour l'indexation de la recherche, mais il s'agit également d'une exigence de conformité 508 pour la classification AA WCAG.
  3. création de pages individuelles par travail, avec un contenu décrivant le travail, les métatags associés au travail, etc.
1
Anson W Han