Je suis nouveau sur le Web et je souhaite télécharger toutes les images sur une page Web à l'aide de marionnettiste:
const puppeteer = require('puppeteer');
let scrape = async () => {
// Actual Scraping goes Here...
const browser = await puppeteer.launch({headless: false});
const page = await browser.newPage();
await page.goto('https://memeculture69.tumblr.com/');
// Right click and save images
};
scrape().then((value) => {
console.log(value); // Success!
});
J'ai regardé les documentation API mais je n'ai pas pu comprendre comment y parvenir. Alors appréciez votre aide.
Il est possible d'obtenir toutes les images sans visiter chaque URL indépendamment. Vous devez écouter toutes les demandes au serveur:
await page.setRequestInterception(true)
await page.on('request', function (request) {
request.continue()
})
await page.on('response', async function (response) {
// Filter those responses that are interesting
const data = await response.buffer()
// data contains the img information
})