J'ai 2 site Web qui est hébergé dans un hébergement partagé.
1er site web
example.com hébergé dans un répertoire racine sous le nom /public_html/
2ème site
example2.com hébergé dans un répertoire de sous-répertoires en tant que /public_html/example_2/
J'ai ceci dans example.com/robots.txt
User-agent: *
Disallow: /example_2/
sitemap: https://www.example.com/sitemap.xml
J'ai ceci dans example2.com/robots.txt
User-agent: *
sitemap: https://www.example2.com/sitemap.xml
Je veux que Google indexe le site Web séparément mais ne me mélange pas. Ce que je sais, c'est si un site Web est soumis, puis tout le répertoire, sauf le Disallow
; Donc, si je Disallow: /example_2/
cela affectera example2.com
. Si tel est le cas, quel est le meilleur moyen d'écrire robots.txt
pour 2 site Web?.
Je serai très bourré si quelqu'un peut me montrer le bon chemin.
Il semble que cPanel, et peut-être d’autres, auxquels il faut s'attendre avec les hôtes Web de nos jours, lors de la création d’un deuxième ou troisième site Web ou même d’un sous-domaine, cPanel, afin de sauvegarder les autorisations de fichiers, crée tout site supplémentaire dans l'espace Web du premier site créé. Cela peut être dû à l'ancien schéma Apache utilisant httpd.conf et à la compatibilité. Qui sait? Il en résulte une confusion et des problèmes potentiels pouvant survenir.
/ public_html/est l'espace Web d'origine des sites pour example.com.
/ public_html/example_2/est le deuxième site pour example2.com
Par exemple.com, la directive directory
du fichier de configuration pointe vers/public_html/et, pour example2.com, la directive directory
du fichier de configuration pointe vers/public_html/example_2 /.
Ce sont des répertoires locaux sur votre système de fichiers et non comment les choses sont vues à partir du Web.
Ce qui est mis dans/public_html/tel que index.html sera vu comme exemple.com/index.html et ce qui est mis dans/public_html/exemple_2/tel que index.html sera vu comme exemple2.com/index.html.
Il en ira de même pour le fichier robots.txt et pour tout fichier .htaccess que vous choisissez de créer. Example.com, robots.txt serait placé dans/public_html/et example2.com, robots.txt, placé dans/public_html/example_2 /.
L'inconvénient de cette configuration est que example.com/example_2/index.html affiche la page d'accueil des sites pour example2.com/index.html. Ce n'est généralement pas un problème. Juste quelque chose à retenir.