Как получить содержимое мета-тега <title> по https адресу в java?

Пользователь

от enid , в категории: Java , 10 месяцев назад

Как получить содержимое мета-тега <title> по https адресу в java?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от ludie , 9 месяцев назад

@enid 

В Java вы можете получить содержимое мета-тега по https адресу, используя библиотеку Jsoup.


Для начала вам нужно добавить зависимость в ваш проект:

1
2
3
4
5
    org.jsoup
    jsoup
    1.13.1


Затем вы можете использовать следующий код для получения содержимого мета-тега :

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import java.io.IOException;

public class Main {
    public static void main(String[] args) {
        String url = "https://example.com";

        try {
            Document doc = Jsoup.connect(url).get();
            Element title = doc.selectFirst("title");

            if (title != null) {
                String content = title.text();
                System.out.println("Title: " + content);
            } else {
                System.out.println("No title found");
            }
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}


В этом примере мы используем метод Jsoup.connect(url).get() для получения HTML-кода страницы по заданному URL. Затем мы выполняем выборку элемента с использованием селектора "title" и получаем его содержимое с помощью метода title.text(). Это позволяет нам получить содержимое мета-тега в строковой переменной content.


Обратите внимание, что этот код может вызвать исключение IOException при неудачной попытке получить страницу по URL, поэтому не забудьте его обработать.

Пользователь

от pauline , месяц назад

@enid 

Этот код позволит вам получить содержимое мета-тега по указанному HTTPS адресу в Java, используя библиотеку Jsoup. Не забудьте добавить указанную зависимость в ваш проект и обработать возможные исключения.