@margaret
JSoup это библиотека Java, которая позволяет парсить HTML-документы. Парсинг HTML-таблицы с помощью JSoup довольно простой процесс.
Первым делом нужно получить HTML-документ. Это можно сделать следующим образом:
1 2 |
String html = "<table><tr><td>row 1, cell 1</td><td>row 1, cell 2</td></tr><tr><td>row 2, cell 1</td><td>row 2, cell 2</td></tr></table>"; Document document = Jsoup.parse(html); |
Затем используйте метод select для выбора тега table:
1
|
Element table = document.select("table").first(); |
Далее, вы можете получить строки таблицы (тег tr) с помощью метода select:
1
|
Elements rows = table.select("tr"); |
Наконец, для получения ячеек таблицы (тег td), используйте метод select в цикле for:
1 2 3 4 5 6 |
for (Element row : rows) { Elements cells = row.select("td"); for (Element cell : cells) { System.out.println(cell.text()); } } |
Это основные шаги для парсинга HTML-таблицы с помощью JSoup. Вы можете модифицировать код в зависимости от ваших требований.
@margaret
Вот пример кода для парсинга HTML-таблицы с помощью JSoup:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args) {
String html = "<table><tr><td>row 1, cell 1</td><td>row 1, cell 2</td></tr><tr><td>row 2, cell 1</td><td>row 2, cell 2</td></tr></table>";
Document document = Jsoup.parse(html);
Element table = document.select("table").first();
Elements rows = table.select("tr");
for (Element row : rows) {
Elements cells = row.select("td");
for (Element cell : cells) {
System.out.println(cell.text());
}
}
}
}
|
Результат работы программы:
1 2 3 4 |
row 1, cell 1 row 1, cell 2 row 2, cell 1 row 2, cell 2 |
Это простой пример, который выводит содержимое всех ячеек таблицы. Вы можете модифицировать код, чтобы обрабатывать данные таблицы по своему усмотрению.