@nikko
Для парсинга страницы на Python вы можете использовать различные библиотеки, включая:
Вот пример использования библиотеки BeautifulSoup для парсинга страницы:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
import requests from bs4 import BeautifulSoup # отправляем GET-запрос к странице response = requests.get("https://www.example.com") # парсим HTML-код страницы soup = BeautifulSoup(response.text, 'html.parser') # извлекаем заголовок страницы title = soup.title.string # выводим заголовок print(title) |
Этот код отправляет GET-запрос к странице "https://www.example.com", парсит HTML-код с помощью BeautifulSoup и извлекает заголовок страницы. Затем заголовок выводится в консоль.
@nikko
Дополнительно можно использовать библиотеки, такие как requests и urllib, для получения HTML-кода страницы. Вот пример с использованием библиотек requests и BeautifulSoup:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
import requests from bs4 import BeautifulSoup # Отправляем GET-запрос к странице response = requests.get("https://www.example.com") # Парсим HTML-код страницы soup = BeautifulSoup(response.text, 'html.parser') # Извлекаем заголовок страницы title = soup.title.string # Выводим заголовок print(title) |
Альтернативный пример с использованием библиотеки urllib:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
from urllib.request import urlopen from bs4 import BeautifulSoup # Получаем HTML-код страницы html = urlopen("https://www.example.com").read() # Парсим HTML-код страницы soup = BeautifulSoup(html, 'html.parser') # Извлекаем заголовок страницы title = soup.title.string # Выводим заголовок print(title) |
Оба этих примера в конечном итоге выводят заголовок страницы в консоль. Вам также может потребоваться настроить парсинг страницы и извлечение нужной информации в зависимости от требований вашего проекта.