web-dev-qa-db-fra.com

Objet à gratter de HTML avec RVEST

Je suis nouveau dans le Web raclant avec R et j'essaie d'obtenir un objet mis à jour quotidien qui n'est probablement pas un texte. L'URL est ici et je souhaite extraire la table de situation quotidienne à la fin de la page. La classe de cet objet est

class="aem-GridColumn aem-GridColumn--default--12 aem-GridColumn--offset--default--0"

Je n'ai pas vraiment expérimenté avec HTML et CSS, donc si vous avez une source ou des conseils utiles sur la manière dont je peux extraire des objets d'une page Web, je l'apprécierais vraiment, puisque SelectorGadget Dans ce cas indique "Aucun chemin valide trouvé. "

2
Pro23

Sans entrer dans l'entreprise d'écrire des racleurs Web, je pense que cela devrait vous aider à sortir:

library(rvest)
url = 'https://covid19.public.lu/en.html'
source = read_html(url)
selection = html_nodes( source , '.cmp-gridStat__item-container' ) %>% html_node( '.number' ) %>% html_text() %>% toString()
1
TMo