web-dev-qa-db-fra.com

télécharger la page Web et les dépendances, y compris les images css

Souvent, je dois télécharger une page Web, puis la modifier hors ligne. J'ai essayé quelques outils et la principale fonctionnalité qui leur manque est le téléchargement d'images référencées dans les fichiers CSS.

Existe-t-il un outil (pour Linux) qui télécharge tout pour que la page Web affiche le même hors ligne (à l'exception d'AJAX)?

67
hoju
wget --page-requisites http://example.com/your/page.html

Cette option oblige Wget à télécharger tous les fichiers nécessaires pour afficher correctement une page html donnée. Cela inclut des éléments tels que des images, des sons et des feuilles de style référencées.

EDIT: meder a raison: stock wget n'analyse pas et ne télécharge pas les images css. Il existe cependant un correctif qui ajoute cette fonctionnalité: [ 1 , 2 ]

MISE À JOUR: Le correctif mentionné ci-dessus a été fusionné dans wget 1.12 , publié le 22 septembre 2009:

** Added support for CSS. This includes:
 - Parsing links from CSS files, and from CSS content found in HTML
   style tags and attributes.
 - Supporting conversion of links found within CSS content, when
   --convert-links is specified.
 - Ensuring that CSS files end in the ".css" filename extension,
   when --convert-links is specified.
86
ax.

Il est possible de le faire via Firefox, voir ce formulaire

  1. Clic-droit
  2. Voir la page d'information
  3. Sélectionner l'onglet média
  4. Mettez en surbrillance tous les fichiers
  5. Enregistrer sous

Référence - http://www.webdeveloper.com/forum/showthread.php?t=21261

11
Jonathan

J'ai rencontré le même problème l'autre jour en travaillant pour un client. Un autre outil qui fonctionne vraiment bien est HTTrack . Le logiciel est disponible dans une version en ligne de commande pour Windows et Linux. Pour Linux, ils ont construit des packages pour la plupart des systèmes d'exploitation les plus courants trouvés ici

Pour mes besoins, cela a mieux fonctionné que wget avec certaines des fonctionnalités/commutateurs ajoutés qui corrigent les liens dans le fichier html.

9
Everette Mills

wget est un excellent choix pour vous. Juste pour plus d'informations, la version wget sur windows pour le moment il n'y a pas de sortie officielle sur gnu pour wget version 1.12. La version actuelle est 1.11

wget version 1.11 ne peut pas télécharger les images/polices dans les fichiers css. Heureusement, vous pouvez trouver une version 1.14 sur cette page. Il a résolu ces problèmes.

http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html

8
Tran Dang Khoa

La version actuelle de Opera (12) permet d'enregistrer une page au format 'HTML avec images'.

Ainsi Opera télécharge également les images référencées dans les fichiers CSS et adapte les URL des images dans le CSS en conséquence.

3
Marco

Dans Firefox:

Fichier-> Enregistrer la page sous-> Page Web, complète

Enregistre tous les javascript et les images et css. Rien d'autre requis :)

1
LiveSource