<td width="10"></td>
<td width="65"><img src="/images/sparks/NIFTY.png" /></td>
<td width="65">5,390.85</td>
<td width="65">5,428.15</td>
<td width="65">5,376.15</td>
<td width="65">5,413.85</td>
Ceci est la source HTML à partir de laquelle je dois extraire les valeurs 5390.85,5428.15, 5376.15, 5413.85. Je voulais le faire en utilisant jsoup. Mais je suis relativement nouveau sur jsoup (aujourd'hui, j'ai commencé à l'utiliser). Alors, comment dois-je faire cela?
URL url = new URL("http://www.nseindia.com/content/equities/niftysparks.htm");
Document doc = Jsoup.parse(url,3*1000);
String text = doc.body().text();
J'ai déjà extrait le contenu du site Web à l'aide de jsoup. mais comment extraire les valeurs dont j'ai besoin? Merci d'avance
Essayez quelque chose comme ça: -
URL url = new URL("http://www.nseindia.com/content/equities/niftysparks.htm");
Document doc = Jsoup.parse(url, 3000);
Element table = doc.select("table[class=niftyd]").first();
Iterator<Element> ite = table.select("td[width=65]").iterator();
ite.next(); // first one is image, skip it
System.out.println("Value 1: " + ite.next().text());
System.out.println("Value 2: " + ite.next().text());
System.out.println("Value 3: " + ite.next().text());
System.out.println("Value 4: " + ite.next().text());
Voici l'impression: -
Value 1: 5,390.85
Value 2: 5,428.15
Value 3: 5,376.15
Value 4: 5,413.85
Voici un exemple utilisant Groovy lang:
def url = "http://www.espn.co.uk/scrum/rugby/match/scores/recent.html"
def doc = Jsoup.connec(url).get()
//Strip the table from the page
def table = doc.select("table").first()
// Strip the rows from the table
def tbRows = table.select("tr")
// For each column in a row, print its contents if not empty
tbRows.each { row ->
def tbCol = row.select("td")
tbCol.each { column ->
if(!column.text().empty) {
println column.text()
}
}
}
Vous pouvez l'enregistrer dans un tableau pour un traitement ultérieur. Juste une autre perspective.