Как получить доступ к содержиому html-тега с помощью jsoup?

Пользователь

от aubree , в категории: Java , 2 месяца назад

Как получить доступ к содержиому html-тега с помощью jsoup?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от jerad.kuphal , 22 дня назад

@aubree 

Для получения содержимого HTML-тега с помощью библиотеки Jsoup необходимо выполнить следующие шаги:

  1. Загрузить HTML-страницу с помощью метода Jsoup.connect() или Jsoup.parse().
  2. Выбрать тег, содержимое которого вы хотите получить, с помощью метода Element.select().
  3. Извлечь содержимое выбранного тега с помощью метода Element.text().


Например, предположим, что у вас есть HTML-страница со следующим тегом <p>:

1
2
3
4
5
<html>
<body>
  <p>Пример текста в теге p</p>
</body>
</html>


Для получения содержимого тега <p> вы можете использовать следующий код на языке Java:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class Example {
  public static void main(String[] args) throws Exception {
    String html = "<html><body><p>Пример текста в теге p</p></body></html>";
    Document doc = Jsoup.parse(html);
    Element pTag = doc.select("p").first();
    String pTagText = pTag.text();
    System.out.println(pTagText);
  }
}


Этот код загружает HTML-страницу из строки html, выбирает первый тег <p> на странице с помощью метода Element.select(), а затем получает текст этого тега с помощью метода Element.text(). Результат выполнения кода будет следующим:

1
Пример текста в теге p