web-dev-qa-db-fra.com

Comment les moteurs de recherche identifient-ils les mots-clés dans les noms de domaine?

Les moteurs de recherche identifient-ils les mots-clés dans les noms de domaine en tant que sous-chaînes ou chaînes séparées par des caractères spéciaux, ou les deux? Par exemple: abcwidgets.com vs abc-widgets.com (évidemment avec "widgets" comme mot clé).

2
Bobe

D'accord, juste pour des raisons d'explication, j'ai pensé que je pourrais intervenir. C'est un processus simple à comprendre. Je pensais l'expliquer théoriquement pour que vous puissiez faire avancer les concepts avec vous et les appliquer dans d'autres domaines.

Vous devez savoir certaines choses pour comprendre comment cela fonctionne.

Le premier est la façon dont Google stocke les termes dans l'index.

Google stocke les termes dans un fichier d'index relativement simple. Ce fichier contient des termes de dictionnaire connus ainsi que des termes trouvés sur Internet qui existent sur plusieurs sites et peuvent être compris à l'aide d'une analyse sémantique. Un numéro de somme de contrôle est attribué à chaque terme de l'index, qui l'identifie de manière unique. Une somme de contrôle est un algorithme numérique qui peut être utilisé pour vérifier rapidement si deux choses sont identiques. Lors de la création d'une somme de contrôle, celle-ci peut représenter un bloc de texte, généralement utilisé contre le contenu ou les termes des moteurs de recherche, avec un numéro unique. Si un terme est trouvé sur le Web et que Google souhaite savoir s’il s’agit d’un terme connu, une somme de contrôle du terme trouvé est créée, puis consultée dans l’index. Google ne compare pas les mots lorsque comparer des chiffres est beaucoup plus efficace et plus petit.

Comment Google fait correspondre les termes à une page Web.

Cela dit, Google crée une série d’index qui lie les termes à la page Web. À l'origine, Google expliquait deux index composés d'un ID de document (page Web) et d'un ID de terme, l'un étant trié par ID de terme et l'autre par ID de document. La raison en est que Google peut trouver quels termes figurent sur une page Web et quelles pages Web contiennent un terme particulier via des index de transfert standard. La sémantique derrière tout cela est fortement suggérée. Google nous indique que la balise de titre est importante, ainsi que tout texte de lien où la page Web est la cible, l'URL/URI et la méta-balise de description. Cela indique que des index supplémentaires existent spécifiquement à cette fin.

Comment les termes sont-ils découverts dans un nom de domaine?

Les programmeurs comprennent les limites de Word. Les limites de mots sont des segments de texte alphanumérique entre les délimiteurs, généralement un espace ou un caractère spécial. Il ne faut pas confondre ce terme avec un terme réel, mais il ne s'agit peut-être pas d'un segment de caractères lisibles. Dans le cas de domain-name.com, le trait d'union (-) serait le délimiteur qui sépare le domaine et le nom et le point (.) Sépare le nom de domaine du TLD. Si Google souhaite vérifier si des termes valides existent dans un nom de domaine, il crée simplement une somme de contrôle pour chaque segment de texte trouvé dans un nom de domaine et le recherche dans l'index des termes.

Dans le cas d'un nom de domaine qui ne contient pas de délimiteur, le processus change légèrement. Pour nomdomaine.com, le nom de domaine peut être examiné en extrayant et en ajoutant les caractères du nom de domaine un par un dans une boucle. C’est une méthode de la vieille école qui n’est plus utilisée et qui vient d’être citée à titre d’illustration. Par exemple, nomdomaine.com peut découvrir domaine et nom en extrayant d, puis faire, puis dom, puis doma, etc. jusqu'à ce que chaque terme soit découvert.

Une autre méthode similaire utilise n - grammes, ce que Google et les moteurs de recherche utilisent réellement. Dans ce cas, n est un nombre où Google utilisera n nombre de caractères à la fois. Par exemple, 3-gramme recevrait dom, puis oma, puis mai, etc., et Google tenterait de voir si le segment n - gramme est un terme valide en créant une somme de contrôle et en le cherchant dans l'indice de terme. N serait augmenté de un et le processus recommencerait jusqu'à ce que tous les termes soient trouvés. Cela permet à un terme comme mal de tête d’être indexé comme mal de tête, mal de tête et mal.

Si un terme valide est trouvé pour un nom de domaine, une entrée est entrée dans l'index d'URL/URI pour le terme et le site/la page. Google ne donne pas trop d'indices à ce sujet, sauf qu'il apparaît que le nom de domaine, le chemin du répertoire et le nom du fichier sont au moins segmentés. Cela peut être stocké dans un seul index ou non. Mais supposons pour le moment que ce n'est pas le cas. Sur la base de cette hypothèse, le nom de domaine aurait son propre index qui identifie le nom de domaine comme ayant le domaine et le nom en tant que termes contenus dans celui-ci.

Simple hein?

Ainsi, vous pouvez voir que Google et tous les moteurs de recherche peuvent facilement trouver des termes existant dans un nom de domaine, quelle que soit la façon dont le nom de domaine est présenté.

Il est important de reconnaître que lorsque nous parlons de rang, nous parlons de deux choses; site et page. Les termes trouvés dans un nom de domaine n'aident pas un site à se classer, mais aident pages à se classer dans les SERP uniquement en dernier recours lorsque les correspondances de requête de recherche sont limitées. Cela est dû à la suroptimisation et aux précédents sites de spam qui tiraient parti de la suroptimisation.

1
closetnoc

La beauté des nouvelles extensions de domaine réside dans le fait que vous pouvez avoir une nouvelle structure appelée keyword.keyword. Lorsque vous pouvez maintenant avoir des mots réels sur le côté droit du point, le jeu a changé. Dans le cas de coffee.club, le site a réussi à se classer à la page 1 du terme "club de café" en quelques semaines. Le seul signal envoyé à Google était le texte d'ancrage issu des liens, qui correspondait dans la plupart des cas au nom de domaine.

Ils peuvent faire les deux. Mais les mots clés dans le nom de domaine ne constituent plus un facteur de classement, ce qui pourrait vous donner un avantage comparable à votre concurrent.

0
Evgeniy