web-dev-qa-db-fra.com

Est-ce que Google OCR et indexer du texte dans les images?

La plupart des images que je publie sont des schémas et des diagrammes. Dans ceux-ci, environ 30% de "l'encre" est dans les légendes et les étiquettes. Je crois que les lecteurs comprennent mieux quand le texte est placé sur la figure que de le mettre dans la légende sous la figure.

Je détesterais si toute cette qualité passait inaperçue des moteurs de recherche. Bien sûr, je peux utiliser alt='' attribut et <figcaption>, mais il serait préférable que le texte à l'intérieur du diagramme soit également indexé.

Jusqu'à présent, j'ai trouvé ces directives de publication d'images de Google. Ils déconseillent d'incorporer du texte dans des images. Mais je me demande, quel âge ont ces lignes directrices? Les vidéos sur cette page datent de 2007 et 2009.

Donc, finalement, mes questions sont:

  • Est-ce que Google OCR et indexer du texte dans les images?
  • Si non, comment pouvez-vous créer des diagrammes d'index Google avec du texte? (J'imagine que des diagrammes peuvent être publiés en tant que SVG. Il y a un signalez que Google indexe à l'intérieur de SVG .)
4
Nick Alexeev

Je ne connais aucune solution vraiment élégante. Quelques options:

  1. SVG, le texte est indexé
  2. PDF avec OCR, il est indexé
  3. Documents PowerPoint ou Word, indexés
  4. Utilisez position CSS pour superposer le texte derrière votre image .
  5. Chargez d'abord le texte, puis lorsque l'image est chargée, supprimez-le dynamiquement. Voir la suggestion de Facebook pour leurs commentaires.
3
hunterhogan

Google ne lit pas les images pour le texte. Votre référence Google parlait de liens vers lesquels une image textuelle est utilisée. Si la balise alt est informative, tout va bien, mais Google préfère les liens à base de texte. C'est tout ce que Google fait référence.

En ce qui concerne votre image, vous avez trois choses qui vous aideront à informer les moteurs de recherche sur l'image:

  • La balise alt.
  • Tout lien vers l'image s'il en existe une.
  • Le contenu entourant l'image.

Le contenu entourant l'image peut être n'importe quoi. Il peut s'agir généralement d'une balise d'en-tête ou d'un paragraphe, par exemple.

En ce qui concerne les images SVG. Les SVG sont des images vectorielles basées sur XML. Si vous pouvez convertir votre diagramme en SVG, celui-ci sera indexé. Mais comment les images SVG sont converties et ensuite utilisées par les moteurs de recherche, je ne peux pas vous dire, je n'ai aucune expérience avec elles. C'est quelque chose à expérimenter.

2
closetnoc

Vous pouvez créer des sitemaps pour les images et les télécharger dans Google Webmaster Tools.

https://support.google.com/webmasters/answer/178636

0
Andreas Furster