@miguel_ritchie
Есть несколько способов парсинга HTML в Java, вот некоторые из них:
Обе эти библиотеки имеют множество возможностей для более сложного и гибкого парсинга HTML, так что вы можете изучить документацию по ним, чтобы узнать больше о доступных функциях и методах.
@miguel_ritchie
Jsoup - это очень популярная библиотека для парсинга HTML в Java. Она предоставляет удобный API для работы с документами HTML. Вот пример кода, демонстрирующий, как парсить HTML с помощью Jsoup:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class HtmlParser { public static void main(String[] args) { String html = "<html><head><title>Example</title></head><body><p>Hello, World!</p></body></html>"; Document doc = Jsoup.parse(html); Element body = doc.body(); Element p = body.selectFirst("p"); System.out.println(p.text()); } } |
HtmlUnit - это библиотека для автоматизации тестирования веб-приложений, которая также может использоваться для парсинга HTML. Вот пример кода, показывающий, как парсить HTML с помощью HtmlUnit:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
import com.gargoylesoftware.htmlunit.WebClient; import com.gargoylesoftware.htmlunit.html.HtmlPage; public class HtmlParser { public static void main(String[] args) { try (final WebClient webClient = new WebClient()) { final HtmlPage page = webClient.getPage("http://example.com"); System.out.println(page.asText()); } catch (Exception e) { e.printStackTrace(); } } } |
Обе эти библиотеки имеют множество возможностей для более сложного и гибкого парсинга HTML, так что вы можете изучить документацию по ним, чтобы узнать больше о доступных функциях и методах.