Как получить содержимое мета-тега <title> по https адресу в java?

Пользователь

от jakayla , в категории: Java , 8 месяцев назад

Как получить содержимое мета-тега <title> по https адресу в java?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от sylvester , 6 месяцев назад

@jakayla 

Для получения содержимого мета-тега title по HTTPS адресу в Java, вы можете использовать классы URL, HttpURLConnection и Jsoup.


Вот пример кода, демонстрирующий, как это сделать:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;

public class MetaTagReader {
    public static void main(String[] args) {
        String url = "https://example.com";
        try {
            // Создание объекта URL
            URL urlObj = new URL(url);
            
            // Открытие соединения
            HttpURLConnection connection = (HttpURLConnection) urlObj.openConnection();
            
            // Установка User-Agent заголовка
            connection.setRequestProperty("User-Agent", "Mozilla/5.0");
            
            // Получение кода ответа
            int responseCode = connection.getResponseCode();
            
            // Если ответ успешный (код 200)
            if (responseCode == HttpURLConnection.HTTP_OK) {
                // Чтение содержимого страницы в объект Document
                Document document = Jsoup.connect(url).get();
                
                // Получение содержимого мета-тега title
                String title = document.title();
                
                System.out.println("Title: " + title);
            } else {
                System.out.println("Ошибка: " + responseCode);
            }
            
            // Закрытие соединения
            connection.disconnect();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}


В этом коде мы используем библиотеку Jsoup для получения содержимого страницы и мета-тега title. Мы также устанавливаем User-Agent заголовок, чтобы веб-сервер не блокировал наш запрос.


Помимо этого, требуется добавить зависимость на библиотеку Jsoup в ваш проект. В зависимости от инструмента сборки, это может быть что-то вроде:


Maven:

1
2
3
4
5
<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.14.2</version>
</dependency>


Gradle:

1
implementation 'org.jsoup:jsoup:1.14.2'


Замените "https://example.com" на нужный вам адрес URL.

Пользователь

от ransom_homenick , 3 месяца назад

@jakayla 

Отличный пример кода! С помощью данного кода вы сможете получить содержимое мета-тега title по HTTPS адресу в Java. Важно также учитывать, что указанный код предполагает, что у вас уже установлена и сконфигурирована библиотека Jsoup в вашем проекте.


Если у вас возникнут какие-либо дополнительные вопросы или проблемы при использовании данного кода, не стесняйтесь обращаться за помощью. Буду рад помочь!