Je lance un site Web, destiné à une région non anglophone, avec un alphabet légèrement différent de celui de l'anglais. Le plan actuel est le suivant. Le nom du site Web et le nom du domaine seront dans la langue locale (pas l'anglais); toutefois, le nom de domaine sera orthographié dans l'alphabet anglais, tandis que le titre du site Web sera identique au même mot, mais correctement orthographié avec des accents. Exemple: "www.litterat.fr" et "Littérat".
La différence entre l'utilisation du nom de domaine et du nom de site Web influence-t-elle le référencement du site? Est-il préférable, en matière de référencement, de choisir un nom qui puisse être épelé de la même manière dans l'alphabet anglais? D'après mon expérience, l'alphabet anglais est utilisé, quelle que soit la langue, lors de la recherche en ligne, de sorte que les internautes recherchent toujours la "litterat" (sans accent, etc.).
On a parlé d’IDN (nom de domaine internationalisé). Pour simplifier les choses, il s’agit de noms de domaine de second niveau contenant des caractères spécifiques à une langue (par exemple, www.café.fr). Ici vous pouvez vérifier quels domaines de premier niveau prennent en charge quels LSP. Vérifiez réponse d'initall pour plus d'informations sur l'utilisation des LSP dans les chemins et les requêtes.
Pour répondre à ma question sur la manière dont les moteurs de recherche associent des mots clés épelés avec ou sans caractères spécifiques à une langue, Google peut indiquer potentiellement que series
et séries
est le même mot clé. Cependant , (plus pertinent pour les mots orthographiés différemment selon les langues et ont des significations différentes, comme séries
), pour que Google établisse la connexion (ou son absence) entre e
et é
, il doit en déduire deux choses:
Langue dans laquelle vous effectuez votre recherche. Langue de votre requête. Vous pouvez le spécifier manuellement via la recherche avancée ou parfois, il le devine. Je présume qu'il peut aussi deviner le problème. Plus vous utilisez de mots-clés spécifiques à cette langue, plus vous aurez de chances de le deviner.
Langue du document analysé, avec laquelle la version ASCII du mot sera comparée (dans cet exemple, series
). Encore une fois, vérifiez réponse d'initall pour savoir comment aider Google à comprendre la langue de votre document.
Une fois que cela a été fait, il peut dire si ces deux orthographes doivent être traitées ou non comme le même mot clé. Google doit comprendre que même si vous n'utilisez pas de caractères spécifiques français (dans cet exemple), vous effectuez une recherche en français.
La raison pour laquelle j'ai utilisé le mot français séries
dans cet exemple, c'est qu'il le montre très bien. Vous l'avez en français et en anglais sans l'accent. Donc, si votre requête de recherche est ambiguë, comme notre series
, à moins que Google n’ait autre chose à ajouter, cela présumera qu’il n’existe aucune corrélation entre votre recherche et séries
dans les documents français. Si vous augmentez votre requête en series romantiques
(essayez-la), Google comprendra que vous effectuez une recherche en français et parmi vos résultats, vous verrez également séries
. Mais cela ne fonctionne pas toujours, vous devriez d'abord le tester avec vos mots-clés. Par exemple, si vous recherchez series francaises
, il associera francaises
à françaises
, mais il n'associera pas series
à séries
. Cela dépend des mots.
Remarque: il convient de souligner que ce problème est très pertinent pour les mots qui, écrits en ASCII simple, pourraient avoir d'autres significations dans d'autres langues, il l'est moins pour les mots qui peuvent être, par une marge distincte, une seule langue.
Conseil: J'ai remarqué que parfois, même si ma requête de recherche non accentuée ne s'associe pas au mot correctement orthographié dans un document (surtout s'il s'agit du titre ou d'un mot clé important de la doc), il est toujours affiché. J'ai suivi le lien, fait une recherche Ctrl-F pour ma requête de recherche non accentuée sans rien trouver, puis vérifié les méta-tags dans la source et le titre de la page était sous forme accentuée ou non. Donc, si vous avez des méta-tags qui peuvent être orthographiés avec des caractères spécifiques à une langue et sans, mettez les deux.
Note de bas de page: J'espère que cela aide. Si vous avez quelque chose à ajouter ou à corriger, continuez.
Voir "Domaines internationalisés et référencement" sur le blog YouMOZ de septembre 2011 pour quelques aperçus techniques, choisir la bonne stratégie et obtenir des réponses sur l'internationalisation sur Google Webmaster Central :
Q: Puis-je utiliser des URL non anglais/non ASCII? A: oui Après le nom de domaine, qui peut être un IDN, nous vous recommandons d’utiliser UTF-8 pour les paramètres de chemin, de nom de fichier et de requête. Google prend en charge les paramètres de chemin d'accès, de nom de fichier et de requête UTF-8 dans le fichier robots.txt. Conseil: facilitez la création de liens vers votre contenu pour les utilisateurs en fournissant des liens copiables avec des URL échappées, de sorte que ces URL restent valables quel que soit le lieu où elles sont liées.
(IDN = nom de domaine internationalisé)
En dehors de cela, définissez la bonne spécification de langue via HTML et à partir des outils de Google/Bing pour les webmasters.
Ayant grandi au Brésil, beaucoup de mots de notre alphabet ont des accents, et je me souviens bien, environ 95,96, des publicités à la télévision pour des sites Web où ils feraient toujours référence au fait que l'adresse Web n'avait pas d'accents. Donc, à mon avis, puisqu'il ne s'agit pas d'un problème nouveau, cela ne devrait pas poser de problème. Si le meilleur nom de votre site Web contient des accents, qu’il en soit ainsi. Juste pour être sûr, vous pouvez également enregistrer la version avec des accents. Je ne vois pas beaucoup d'avantages, mais vous pouvez. http://www.netim.com/domain/services/domain-name-idn.php