web-dev-qa-db-fra.com

Wordpress site soumis à Baidu ne se fait pas ramper

J'ai un site Web (blog WordPress, domaine personnalisé .NET, hébergé en Allemagne) que j'ai envoyé via les outils Baidu Webmaster, via tous les outils disponibles, c'est-à-dire la soumission directe de l'URL, Sitemaps et l'extrait JavaScript qui Auto-soumet de nouveaux liens. Pour toutes les soumissions manuelles, il n'y a pas eu d'erreurs et rien n'indique aucun problème - sauf que cela ne sait tout simplement pas du tout. Tout fonctionne bien sur Google et Bing cependant.

La page utilise HTTPS (crypterons) et il y a une redirection automatique à HTTPS en place, mais aussi loin que j'ai compris la documentation qui devrait être correcte, et à nouveau, le rapport sur HTTPS n'a également indiqué aucun problème avec le certificat. En outre, la page est accessible sans VPN, donc je ne soupçonnais rien de mal sur ce front.

Y a-t-il de bons pointeurs sur la façon de commencer à déboguer cela?


robots.txt:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
2
ferada

Whoa Boy, cette approche et Baidu ne joueront pas bien du tout ....

1) Vérifiez si le domaine est bloqué par le "grand pare-feu" avec https://fr.greatfire.org/analyzer . Si oui, désolé, il y a quelque chose de "désagréable" et vous aurez probablement votre site bloqué à nouveau, peu importe ce que vous faites pour essayer de contourner les censeurs. Mais sinon:

2) Voir si le domaine est accessible via des clients situés à la Chine avec http://www.webkaka.com/webcheck.aspx . Sinon, essayez de refléter le site sur un CDN chinois et utilisez le CCTLD de Chine pendant que vous y êtes. Si vous obtenez un tas de 200, alors:

3) Assurez-vous que le robotler peut rendre votre page correctement en masquant comme Baidubot. Une page pratiquement vierge en raison d'un faible rendu sera arrêtée avant d'être indexée, même il passe les rapports d'outils "en quelque sorte. Utilisez A Chrome Extension ou https://technicalseo.com/tools/fetch-render/ . S'il a l'air vraiment génial, alors retirez autant de JavaScript, Ajax, Quel que soit l'expérience "riche" Tech Web que vous utilisez. S'il passe, alors:

4) Essayez de pousser vos URL à Baidu via leur API. Ce n'est pas facile.

3
I Capulet

J'ai eu le même problème lors du lancement d'un site pour un client là-bas. Lors de la soumission de n'importe quel site à Baidu, il s'attend à un site entièrement chinois hébergé en Chine. Si vous ne pouvez pas fournir une version mandarine entièrement traduite pour votre Wordpress site, essayez d'ajouter ceci à votre HTML:

<META HTTP-EQUIV="Content-Language" CONTENT="ZH">

Placez la balise Meta ci-dessus sur l'une de vos pages HTML/PHP, elle permet à Baidu de savoir que vous avez un site chinois qui est une exigence en fonction de leurs directives communautaires et de soumettre à nouveau votre site.

Bonne chance!

2
Waleed

Je n'ai pas spécifiquement traité ce problème, donc je "pense à voix haute" alors que j'écris ceci:

Je n'ai jamais été particulièrement préoccupé par Baidu, mais ma compréhension est que c'est un site de médias sociaux chinois, donc :

  • Est-ce qu'ils permettent aux utilisateurs de créer des sous-domaines (tels que Google Sites, Blogger, WordPress.com, etc.)?
  • Autorient-ils les utilisateurs de créer des listes de cartes?
  • Y a-t-il un équivalent chinois à la liste de Craig où vous pourriez poster une annonce avec un backlink?
  • Est-ce qu'ils permettent à tout type d'annonces payantes (qui les alerteraient efficacement à un nouveau site Web annonceurs)?

Si rien de ce qui précède ne semble viable, je dois poser quelques autres questions de suivi :

  • Le contenu est-il de quelque manière que ce soit répréhensible au gouvernement chinois?
  • Le contenu est-il probablement susceptible d'être signalé par programme (tons de peau, comme du porno)?
  • Est le contenu en chinois et avez-vous mis en œuvre des balises hreflang?

Si contempler ce qui précède ne convient pas à vos besoins, avez-vous examiné d'autres moyens de promotion (programmatiques et manuels) tels que :

  • Développer la liste des services à "Ping" chaque fois que vous mettez à jour votre contenu (dans la zone WordPress Zone admin) avec une attention particulière aux serveurs susceptibles d'être pertinents pour le marché chinois?
  • Faire de la sensibilisation via les médias sociaux aux personnes en Chine?
  • Commentant sur des blogs de haut niveau dans votre secteur qui sont susceptibles d'être spidés par Baidu?
  • Envoi de votre site Web aux annuaires chinois, aux sites de bookmarking, aux raccourpateurs d'URL, etc.?

Dernier point mais non le moindre :

  • (Et cela s'appuie sur la dernière question) Avez-vous essayé de construire des liens de sites que Baidu est susceptible d'arpider et de "pinging" ces liens (c'est-à-dire un bâtiment de liaison à plusieurs niveaux)?

Modifiez votre fichier robots.txt

Ce n'est probablement pas probablement une mauvaise idée de supprimer des références WordPress tel que wp-admin de ton robots.txt fichier. Je crois WordPress indique automatiquement les moteurs de recherche de ne pas ramper wp-admin Avec une directive "Noindex" (qui pourrait être une en-tête HTTP, plutôt qu'une balise méta).

Et même si ce n'est pas le cas, voulez-vous vraiment votre robots.txt Fichier pour annoncer au monde que vous avez un site Web en cours d'exécution WordPress?

Ne me trompez pas, j'adore WordPress et la plupart de mes sites Web l'utilisent, mais c'est la popularité en tant que CMS permet également d'annoncer publiquement les vulnérabilités du point de vue de la sécurité.

Essayer robots.txt

User-agent: *
Allow: /
1
adam-asdf