Как парсить html таблицу в jsoup?

Пользователь

от margaret , в категории: Java , 8 месяцев назад

Как парсить html таблицу в jsoup?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от marshall.cummings , 8 месяцев назад

@margaret 

JSoup это библиотека Java, которая позволяет парсить HTML-документы. Парсинг HTML-таблицы с помощью JSoup довольно простой процесс.


Первым делом нужно получить HTML-документ. Это можно сделать следующим образом:

1
2
String html = "<table><tr><td>row 1, cell 1</td><td>row 1, cell 2</td></tr><tr><td>row 2, cell 1</td><td>row 2, cell 2</td></tr></table>";
Document document = Jsoup.parse(html);


Затем используйте метод select для выбора тега table:

1
Element table = document.select("table").first();


Далее, вы можете получить строки таблицы (тег tr) с помощью метода select:

1
Elements rows = table.select("tr");


Наконец, для получения ячеек таблицы (тег td), используйте метод select в цикле for:

1
2
3
4
5
6
for (Element row : rows) {
    Elements cells = row.select("td");
    for (Element cell : cells) {
        System.out.println(cell.text());
    }
}


Это основные шаги для парсинга HTML-таблицы с помощью JSoup. Вы можете модифицировать код в зависимости от ваших требований.