web-dev-qa-db-fra.com

robots.txt pour un site Web hébergé dans un sous-répertoire

J'ai 2 site Web qui est hébergé dans un hébergement partagé.
1er site web
example.com hébergé dans un répertoire racine sous le nom /public_html/

2ème site
example2.com hébergé dans un répertoire de sous-répertoires en tant que /public_html/example_2/

J'ai ceci dans example.com/robots.txt

User-agent: *
Disallow: /example_2/
sitemap: https://www.example.com/sitemap.xml

J'ai ceci dans example2.com/robots.txt

User-agent: *
sitemap: https://www.example2.com/sitemap.xml

Je veux que Google indexe le site Web séparément mais ne me mélange pas. Ce que je sais, c'est si un site Web est soumis, puis tout le répertoire, sauf le Disallow; Donc, si je Disallow: /example_2/ cela affectera example2.com. Si tel est le cas, quel est le meilleur moyen d'écrire robots.txt pour 2 site Web?.

Je serai très bourré si quelqu'un peut me montrer le bon chemin.

2
Raunak Gupta

Il semble que cPanel, et peut-être d’autres, auxquels il faut s'attendre avec les hôtes Web de nos jours, lors de la création d’un deuxième ou troisième site Web ou même d’un sous-domaine, cPanel, afin de sauvegarder les autorisations de fichiers, crée tout site supplémentaire dans l'espace Web du premier site créé. Cela peut être dû à l'ancien schéma Apache utilisant httpd.conf et à la compatibilité. Qui sait? Il en résulte une confusion et des problèmes potentiels pouvant survenir.

/ public_html/est l'espace Web d'origine des sites pour example.com.

/ public_html/example_2/est le deuxième site pour example2.com

Par exemple.com, la directive directory du fichier de configuration pointe vers/public_html/et, pour example2.com, la directive directory du fichier de configuration pointe vers/public_html/example_2 /.

Ce sont des répertoires locaux sur votre système de fichiers et non comment les choses sont vues à partir du Web.

Ce qui est mis dans/public_html/tel que index.html sera vu comme exemple.com/index.html et ce qui est mis dans/public_html/exemple_2/tel que index.html sera vu comme exemple2.com/index.html.

Il en ira de même pour le fichier robots.txt et pour tout fichier .htaccess que vous choisissez de créer. Example.com, robots.txt serait placé dans/public_html/et example2.com, robots.txt, placé dans/public_html/example_2 /.

L'inconvénient de cette configuration est que example.com/example_2/index.html affiche la page d'accueil des sites pour example2.com/index.html. Ce n'est généralement pas un problème. Juste quelque chose à retenir.

1
closetnoc