Nous sommes une agence Web avec plus de 100 clients, dont certains peuvent avoir Flash en place sur leurs sites Web.
Avec Google s'éloigne de Flash (que nous soutenons pleinement), nous souhaitons offrir à nos clients le plus de soutien possible pour leur permettre de se retirer de Flash.
Cependant, nous n'avons pas de moyen clair d'identifier les sites qui utilisent Flash - d'autant plus qu'il est possible d'incorporer des objets Flash dans certains CMS (pour qu'il n'apparaisse pas dans nos référentiels de code).
Quel est le moyen le plus simple de détecter l’utilisation de Flash sur plusieurs sites Web? Existe-t-il des services en ligne, chrome extensions ou logiciels de numérisation utilisables?
Un rapide Google a seulement renvoyé des suggestions pour rechercher le code source des objets Flash, ce qui prend du temps et est complexe du point de vue technique.
Il y a de nombreuses façons d'aborder cela, voici certaines qui me viennent à l'esprit:
Avec recherche Google et opérateurs pris en charge , vous devriez pouvoir trouver les fichiers Flash d'Adobe, à condition que les sites ne bloquent pas l'indexation de ces fichiers via les en-têtes noindex ou robots.txt.
Utilisez quelque chose comme ceci:
site:example1.com OR site:example2.com OR site:example3.com + "flv"
site:example1.com OR site:example2.com OR site:example3.com + "fla"
site:example1.com OR site:example2.com OR site:example3.com + "swf"
site:example1.com OR site:example2.com OR site:example3.com + "swc"
Vous pouvez connaître le contenu des ressources d'un site en créant un sitemap, puis après avoir généré tous les sitemaps, vous effectuez une recherche en masse dans tous les fichiers en même temps pour les extensions de fichier: flv, fla, swf et swc. Il existe de nombreux générateurs de sitemap disponibles sur le net, certains à l'essai, d'autres gratuits ... par exemple Screaming Frog générateur de sitemap .
Vous savez probablement ce que HTTrack est, mais pour les lecteurs qui n'en ont pas, il s’agit essentiellement d’une application de site Web clone, qui clone en principe un site Web de distant à local.
Vous pouvez simplement utiliser HTTrack et coller en masse toutes les URL du site, puis ajuster les paramètres pour rechercher et télécharger uniquement les extensions de fichier mentionnées ci-dessus, en ignorant tous les autres fichiers. Ceci créera alors des dossiers avec les adresses du site et vous facilitera la tâche. faire simplement une recherche en masse pour ces fichiers.