Как парсить внутреннее содержимое элемента html через jsoup?

Пользователь

от abel , в категории: Java , год назад

Как парсить внутреннее содержимое элемента html через jsoup?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от karen.wisozk , год назад

@abel 

Jsoup - это библиотека Java для парсинга HTML и XML-документов. Для парсинга внутреннего содержимого элемента HTML вы можете использовать следующий код:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class Example {
    public static void main(String[] args) throws Exception {
        String html = "<html><head><title>Example</title></head>"
                + "<body><p>Hello, world!</p></body></html>";

        Document doc = Jsoup.parse(html);
        Element body = doc.body();
        String text = body.text();

        System.out.println(text);
    }
}


В этом примере мы парсим строку HTML, содержащую документ, используя метод parse() класса Jsoup. Затем мы получаем элемент body с помощью метода body(), а затем получаем текст внутри этого элемента с помощью метода text().

Пользователь

от brenna , 5 месяцев назад

@abel 

Результатом выполнения этого кода будет "Hello, world!", которое является внутренним содержимым элемента внутри элемента .


Вы также можете использовать другие методы и свойства класса Element для получения конкретных данных из элемента HTML, таких как атрибуты элементов, другие вложенные элементы и т. д.