Bien souvent, je tombe sur un site Web agréable ou fonctionnel et je me demande quelle technologie a été utilisée pour le créer. Quelles techniques sont disponibles pour comprendre avec quoi un site web particulier a été construit?
Peu de frameworks semblent inclure un méta-tag de type générateur comme le font les éditeurs web. Existe-t-il des signes révélateurs de langages et/ou de cadres particuliers?
Résumé des réponses
Les URL de site peuvent trahir le framework et/ou le langage de programmation, mais ne sont pas fiables (par exemple, des extensions de fichier telles que .asp). Les en-têtes de réponse HTTP, les cookies, les feuilles de style et les commentaires sources peuvent également donner des indices.
Quelques bons outils pour interroger les détails du site (sans doute, il y en a beaucoup plus):
Addons Firefox:
Extensions Chrome:
Bookmarklets:
Il y a toutes sortes de choses que vous pouvez rechercher, mais cela ne vous donne pas vraiment de certitude quant à la technologie derrière un site. En général, les gens voudront masquer ce type d'informations, car plus elles sont exposées, plus il est facile pour les parties malveillantes d'identifier les failles de sécurité ou les failles de déni de service.
Si j'étais intéressé, je regarderais probablement, sans ordre particulier, à:
Incidemment, les outils mentionnés dans d'autres réponses ne concernent que certaines des propriétés susmentionnées du site pour vous, bien que de manière automatique et légèrement plus rapide. :)
Vous pouvez utiliser http://builtwith.com pour déterminer le serveur et le langage de programmation utilisés. Par exemple, il m'a dit que SO utilise IIS7, Google Analytics, html4 et utf8.
Si vous voulez connaître le cadre ... eh bien, ce ne sera probablement pas possible en consultant simplement le site. Pourquoi ne leur écrivez-vous pas un email? ;)
J'utilise 1 plug-in pour Firefox qui me donne l'adresse IP et le pays pour le site Web d'hébergement et son nom de serveur Web appelé Détails du domaine , et pour le framework javascript que j'utilise WTFramework
J'ai encore besoin de me demander sur quel script il a été écrit, mais c'est un début :)
J'espère que ça aide.
P.S. la sortie sera quelque chose comme ça:
alt text http://img88.imageshack.us/img88/2505/200812282328ha0.png
Les URL peuvent donner beaucoup d'indices, en particulier avec les systèmes de gestion de contenu.
Par exemple, " http://abcxyz.com/ node/46 " ressemble beaucoup à Drupal.
De plus, de nombreux frameworks utilisent des fichiers JavaScript et CSS standard.
Découvrez Chrome Sniffer , une excellente solution légère.
Certaines personnes pourraient même délibérément occulter la technologie qu’elles utilisent. Après tout, Tweak Apache ne m'a pas pris longtemps pour que ".asp" exécute les scripts Perl et mette "powered by Microsoft IIS" dans mon pied de page malgré le fait que j'utilise MySQL.
De cette façon, vous passeriez tout votre temps à essayer de pirater mon site en utilisant des vulnérabilités qu’il n’a pas réellement.
J'utilise WebParser ( http://www.cybermake.com ) qui permet de déterminer le CMS utilisé par un site Web. Il permet de déterminer le système de gestion de contenu pour plusieurs sites Web et d'extraire la liste des sites Web des moteurs de recherche pour une liste donnée de mots-clés. Outil puissant.
http://guess.scritch.org/ le fait pour les CMS.
Il suffit d’afficher l’URL pour essayer de deviner le CMS. Dans ce cas, il me dit que mon blog est en cours d'exécution wordpress 3.4.2 (ce qui est correct, je viens de vérifier!)
L'examen des cookies fournis par le site peut révéler le cadre sous-jacent. CodeIgniter, par exemple, utilise par défaut un cookie ci_sessions. Les sites utilisant PEAR Auth feront quelque chose de similaire.
Vous pouvez utiliser http://builtbased.com/ pour déterminer le serveur, le framework et le langage de programmation utilisés.
http://www.similartech.com est un nouvel outil que nous avons conçu. C’est ce que nous faisons et le présente très bien.
La plupart des sites ASP.NET sont faciles à identifier à partir du fichier .aspx dans les URL. Il existe également des signes indicateurs dans la source HTML, tels qu'un champ de formulaire masqué nommé __VIEWSTATE
ou le code JavaScript WebResource.axd. Les éléments HTML auront souvent des attributs id commençant par quelque chose comme _ctl0
.
Les sites Rails incluent généralement les feuilles de style de/stylesheets et les fichiers JavaScript de/javascripts et chaque URL contient généralement une chaîne de requête contenant un horodatage permettant de contrecarrer la mise en cache. Les champs de formulaire suivront souvent la convention de nommage de model_name[attribute_name]
.
Il existe également W3Techs , qui vous montre une grande partie de cette information.
Sous Linux/OSX, j'utilise souvent la commande simple curl -sI www.site.com
Vous pouvez utiliser domaintools.com pour rechercher des informations sur le serveur pour un site Web et déterminer s'il s'agit d'une source ouverte/Microsoft:
http://whois.domaintools.com/stackoverflow.com
Et après cela, il suffit de regarder dans le pied de page des informations telles que "Powered by WordPress" ou "vBulletin", etc.
oui, il y a des signes indicateurs pour les CMS courants comme Drupal, Joomla, Pligg, RoR etc. .. Les fichiers ASP.NET sont faciles à repérer aussi .. mais à mesure que le cadre devient plus obscur, il devient difficile de le déduire ..
Ce que j’ai l'habitude de comparer, c’est comparer le site que j’observe à un autre site qui, je le sais, est construit avec une technologie particulière. Cela fonctionne parfois ..
Allez à Netcraft et utilisez la rubrique "Qu'est-ce que ce site fonctionne?" zone de recherche dans le coin supérieur gauche. Cliquez ici pour le rapport sur Stack Overflow . Cela ne sera pas forcément correct (par exemple, il pourrait y avoir une mise en cache ou un équilibrage de charge), mais cela vous donne souvent l’indice dont vous avez besoin.
http://www.quarkbase.com/ est un outil très agréable et un site d'information