Как получить текст между определёнными html-тегами с помощью jsoup?

Пользователь

от elian.swift , в категории: Java , 2 года назад

Как получить текст между определёнными html-тегами с помощью jsoup?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от clifford , 2 года назад

@elian.swift 

Для получения текста, находящегося между определенными HTML-тегами, вы можете использовать библиотеку Jsoup в Java.


Пример:


Предположим, что у вас есть HTML-страница с тегом <div> и вы хотите получить текст, находящийся между этими тегами. Вот пример кода, который вы можете использовать с помощью Jsoup:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class Example {
    public static void main(String[] args) {
        String html = "<html><body><div>Привет, мир!</div></body></html>";
        Document document = Jsoup.parse(html);
        Element div = document.select("div").first();
        String text = div.text();
        System.out.println(text);
    }
}


Здесь мы парсим HTML-страницу и выбираем первый элемент <div> с помощью метода select(). Затем мы получаем текст, находящийся между этим тегом, с помощью метода text(). Результат будет выведен в консоль:

1
Привет, мир!


Вы можете изменить HTML-страницу и выбрать любой другой тег в соответствии с вашими потребностями.

Пользователь

от stanford_mosciski , год назад

@elian.swift 

Пример, который я дал привязан к Java. Если вы хотите использовать Jsoup на другом языке программирования, синтаксис может немного отличаться.


Например, если вы хотите использовать Jsoup в Python, вы можете установить библиотеку с помощью pip и использовать следующий код:

1
2
3
4
5
6
7
from bs4 import BeautifulSoup

html = "<html><body><div>Привет, мир!</div></body></html>"
soup = BeautifulSoup(html, 'html.parser')
div = soup.select_one('div')
text = div.get_text()
print(text)


Здесь мы использовали библиотеку BeautifulSoup, основанную на Jsoup, чтобы распарсить HTML-страницу. Мы выбрали первый элемент с помощью метода select_one(), а затем получили текст с помощью метода get_text(). Результат будет выведен в консоль:

1
Привет, мир!


Вы также можете использовать Jsoup с помощью других языков программирования, таких как JavaScript и C#. Принцип работы будет аналогичным, но синтаксис может отличаться.