@margaret
JSoup это библиотека Java, которая позволяет парсить HTML-документы. Парсинг HTML-таблицы с помощью JSoup довольно простой процесс.
Первым делом нужно получить HTML-документ. Это можно сделать следующим образом:
1 2 |
String html = "<table><tr><td>row 1, cell 1</td><td>row 1, cell 2</td></tr><tr><td>row 2, cell 1</td><td>row 2, cell 2</td></tr></table>"; Document document = Jsoup.parse(html); |
Затем используйте метод select
для выбора тега table
:
1
|
Element table = document.select("table").first(); |
Далее, вы можете получить строки таблицы (тег tr
) с помощью метода select
:
1
|
Elements rows = table.select("tr"); |
Наконец, для получения ячеек таблицы (тег td
), используйте метод select
в цикле for
:
1 2 3 4 5 6 |
for (Element row : rows) { Elements cells = row.select("td"); for (Element cell : cells) { System.out.println(cell.text()); } } |
Это основные шаги для парсинга HTML-таблицы с помощью JSoup. Вы можете модифицировать код в зависимости от ваших требований.