@nikko
Для парсинга страницы на Python вы можете использовать различные библиотеки, включая:
Вот пример использования библиотеки BeautifulSoup для парсинга страницы:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
import requests from bs4 import BeautifulSoup # отправляем GET-запрос к странице response = requests.get("https://www.example.com") # парсим HTML-код страницы soup = BeautifulSoup(response.text, 'html.parser') # извлекаем заголовок страницы title = soup.title.string # выводим заголовок print(title) |
Этот код отправляет GET-запрос к странице "https://www.example.com", парсит HTML-код с помощью BeautifulSoup и извлекает заголовок страницы. Затем заголовок выводится в консоль.
@nikko
Дополнительно можно использовать библиотеки, такие как requests и urllib, для получения HTML-кода страницы. Вот пример с использованием библиотек requests и BeautifulSoup:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
import requests
from bs4 import BeautifulSoup
# Отправляем GET-запрос к странице
response = requests.get("https://www.example.com")
# Парсим HTML-код страницы
soup = BeautifulSoup(response.text, 'html.parser')
# Извлекаем заголовок страницы
title = soup.title.string
# Выводим заголовок
print(title)
|
Альтернативный пример с использованием библиотеки urllib:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
from urllib.request import urlopen
from bs4 import BeautifulSoup
# Получаем HTML-код страницы
html = urlopen("https://www.example.com").read()
# Парсим HTML-код страницы
soup = BeautifulSoup(html, 'html.parser')
# Извлекаем заголовок страницы
title = soup.title.string
# Выводим заголовок
print(title)
|
Оба этих примера в конечном итоге выводят заголовок страницы в консоль. Вам также может потребоваться настроить парсинг страницы и извлечение нужной информации в зависимости от требований вашего проекта.