J'ai besoin d'extraire le nom de domaine exact de n'importe quelle URL.
Par exemple,
URL: http://www.google.com -> Domaine: google.com
Url: http://www.google.co.uk/path1/path2 -> Domaine: google.co.uk
Comment cela est-il possible en c #? Existe-t-il une liste complète de TLD ou un analyseur pour cette tâche?
Vous pouvez utiliser la classe Uri pour accéder à tous les composants d'un URI:
var uri = new Uri("http://www.google.co.uk/path1/path2");
var Host = uri.Host;
// Host == "www.google.co.uk"
Cependant, il n'existe pas de moyen intégré pour supprimer le sous-domaine "www" de "www.google.co.uk". Vous devez implémenter votre propre logique, par exemple.
var parts = Host.ToLowerInvariant().Split('.');
if (parts.Length >= 3 &&
parts[parts.Length - 1] == "uk" &&
parts[parts.Length - 2] == "co")
{
var result = parts[parts.Length - 3] + ".co.uk";
// result == "google.co.uk"
}
Utilisation:
new Uri("http://www.stackoverflow.com/questions/5984361/c-sharp-getting-exact-domain-name-from-any-url?s=45faab89-43eb-41dc-aa5b-8a93f2eaeb74#new-answer").GetLeftPart(UriPartial.Authority).Replace("/www.", "/").Replace("http://", ""));
Contribution:
http://www.stackoverflow.com/questions/5984361/c-sharp-getting-exact-domain-name-from-any-url?s=45faab89-43eb-41dc-aa5b-8a93f2eaeb74#new-answer
Sortie:
stackoverflow.com
Fonctionne également pour les suivants.
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co.uk
http: //localhost.intranet: 88/path1/path2 → localhost.intranet: 88
http://www2.google.com → www2.google.com
Essayez la classe System.Uri.
http://msdn.Microsoft.com/en-us/library/system.uri.aspx
new Uri("http://www.google.co.uk/path1/path2").Host
qui renvoie "www.google.co.uk". A partir de là, c'est de la manipulation de cordes. : /
utilisation:
var uri =new Uri(Request.RawUrl); // to get the url from request or replace by your own
var domain = uri.GetLeftPart( UriPartial.Authority );
Contribution:
Url = http://google.com/?search=true&q=how+to+use+google
Résultat:
domain = google.com
Une autre variante, sans dépendances:
string GetDomainPart(string url)
{
var doubleSlashesIndex = url.IndexOf("://");
var start = doubleSlashesIndex != -1 ? doubleSlashesIndex + "://".Length : 0;
var end = url.IndexOf("/", start);
if (end == -1)
end = url.Length;
string trimmed = url.Substring(start, end - start);
if (trimmed.StartsWith("www."))
trimmed = trimmed.Substring("www.".Length );
return trimmed;
}
Exemples:
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co.uk
http://localhost.intranet:88/path1/path2 → localhost.intranet:88
http://www2.google.com → www2.google.com