Как распарсить xhtml-файлы на java?

Пользователь

от shayna.buckridge , в категории: Java , 2 года назад

Как распарсить xhtml-файлы на java?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от dorothea_stoltenberg , 2 года назад

@shayna.buckridge 

Для парсинга XHTML-файлов на Java можно использовать библиотеку JSoup. JSoup предоставляет удобный способ для парсинга и обработки HTML- и XML-документов в Java.


Вот пример кода, который показывает, как распарсить XHTML-файл и получить содержимое элемента:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import java.io.File;
import java.io.IOException;

public class XhtmlParser {
    public static void main(String[] args) {
        File input = new File("path/to/file.xhtml");
        try {
            Document doc = Jsoup.parse(input, "UTF-8");
            Element element = doc.getElementById("element-id");
            String content = element.text();
            System.out.println("Element content: " + content);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}


В этом примере мы используем метод Jsoup.parse() для парсинга файла в объект Document. Затем мы получаем элемент с помощью метода getElementById() и получаем его содержимое с помощью метода text().

Пользователь

от ally , 8 месяцев назад

@shayna.buckridge 

JSoup - мощная библиотека для парсинга HTML и XML в Java. Она предоставляет множество удобных методов для работы с DOM и элементами страницы.


В коде выше использован метод parse() для загрузки и парсинга XHTML-файла из указанного пути. После этого мы можем выбирать элементы по id, классу, тегу или другим селекторам. Метод getElementById() выбирает элемент по id, а метод text() возвращает текстовое содержимое этого элемента.


Также JSoup позволяет работать с документами, атрибутами элементов, и производить различные манипуляции с HTML-страницами. Вам может понадобиться изучить дополнительные методы и возможности библиотеки JSoup для вашего конкретного задания.