Si j'ai un fichier .txt contenant une liste d'URL, comment puis-je obtenir que Chrome ou Firefox les ouvre, une URL par onglet, puis enregistrez la page séparément dans chaque onglet?
Toute plate-forme fera l'affaire: Windows, Mac, Linux.
Vous pouvez ouvrir les URL dans les onglets en collant simplement dans une console Invite cmd
vos URL comme ceci.
start chrome http://yoururls/foo.html &
start chrome http://yoururls/bar.html &
.
.
.
ou
start firefox http://yoururls/foo.html &
start firefox http://yoururls/bar.html &
.
.
.
Bien que la question mentionne spécifiquement Chrome et Firefox, si vous voulez enregistrer le contenu de chaque page, wget est créé pour cette tâche. Par exemple.:
wget --input-file=list_of_urls.txt
Vous pouvez même spécifier un agent d'utilisateur spécifique au cas où vous voudriez que le serveur voie la requête comme un navigateur donné:
wget --user-agent=some_specific_user_agent_string --input-file=list_of_urls.txt
Répondant à ma propre question, je ne connaissais pas certains plug-ins que j'avais déjà vus, mais un examen plus approfondi a confirmé qu'ils devraient faire le travail.
Deux étapes:
1) Exécutez Firefox ou Chrome à partir de la ligne de commande, en passant la liste des sites en tant que paramètre ou fichier contenant une liste, en utilisant l’une des méthodes suivantes:
2) Utilisez ensuite l’un des plug-ins suivants selon vos besoins pour enregistrer tout le contenu de chaque onglet.
Firefox:
https://addons.mozilla.org/en-US/firefox/addon/unmht/
Extrait de la page du plug-in (particularités intéressantes pour cette question):
À propos de ce module: UnMHT fournit les fonctionnalités suivantes:
- Enregistrer la page Web en tant que fichier MHT.
- Insérez l'URL de la page Web et la date que vous avez sauvegardée dans un fichier MHT enregistré.
- Enregistrez plusieurs onglets en tant que fichiers MHT à la fois.
- Enregistrez plusieurs onglets dans un seul fichier MHT.
- Enregistrez une page Web en un seul clic dans un répertoire prédéfini avec la fonction d'enregistrement rapide.
- Convertissez les fichiers HTML et le répertoire contenant les fichiers utilisés par HTML en fichier MHT.
- Voir le fichier MHT enregistré par UnMHT, IE, PowerPoint, etc.
Chrome: Extension: ZipTabs https://chrome.google.com/webstore/detail/ziptabs/ccnanbffbfbcgfmmkgejodommhidpjba
De la page d'extension:
- enregistrer plusieurs pages ouvertes dans un fichier Zip contenant un seul fichier HTML avec toutes les ressources incluses (images, feuilles de style, cadres, etc.)
- ouvrir un fichier Zip contenant des archives dans des onglets Notes:
- cette extension nécessite que "SingleFile Core" soit déjà installé (suivez les instructions d'installation)
Faire en sorte que tous les onglets s'ouvrent séparément par lot n'est pas si difficile.
Code:
@echo off
open chrome [enter URL 1]
open chrome [enter URL 2]
...
exit
Pour ce qui est de la sauvegarde, je ne sais pas si cela est possible par lots. Je pourrais toutefois avoir tord.