Je veux extraire les noms des universités et de leurs sites Web de ce site dans des listes.
Dans Python je l'ai fait avec BeautifulSoup v4:
import requests
from bs4 import BeautifulSoup
import pandas as pd
page = requests.get('https://thebestschools.org/features/best-computer-science-programs-in-the-world/')
content = BeautifulSoup(page.text, 'html.parser')
college_name = []
college_link = []
college_name_list = content.find_all('h3',class_='college')
for college in college_name_list:
if college.find('a'):
college_name.append(college.find('a').text)
college_link.append(college.find('a')['href'])
J'aime beaucoup la programmation en Julia et comme c'est très similaire à Python, je voulais savoir si je pouvais aussi faire du web scraping en Julia. Toute aide serait appréciée.
Oui.
Aux fins du web-scraping, Julia dispose de trois bibliothèques:
requests
de python ),J'ai vu que vous êtes jeune (16) de votre profil et votre implémentation python est également correcte.
Par conséquent, je vous suggère de essayer de faire une tâche de web-scraping avec ces trois bibliothèques pour mieux comprendre comment elles fonctionnent.
La tâche que vous souhaitez faire, malheureusement, ne peut pas encore être accomplie avec Cascadia depuis le h3
est dans un <span>
qui n'est actuellement pas un SelectorType implémenté dans Cascadia.jl
Source