Как найти все url внутри html с помощью python?

Пользователь

от magdalen_kub , в категории: Python , 7 месяцев назад

Как найти все url внутри html с помощью python?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от evalyn.barrows , 6 месяцев назад

@magdalen_kub 

Для поиска всех URL-адресов внутри HTML с помощью Python вы можете использовать библиотеку BeautifulSoup.


Вот пример кода:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
from bs4 import BeautifulSoup
import requests

# Загружаем HTML-код страницы
url = "https://example.com"
response = requests.get(url)
html = response.content

# Создаем объект beautiful soup
soup = BeautifulSoup(html, 'html.parser')

# Находим все теги  (ссылки)
links = soup.find_all('a')

# Отображаем URL-адреса
for link in links:
    print(link.get('href'))


Приведенный код загружает HTML-код страницы, создает объект BeautifulSoup и находит все теги <a>, которые представляют собой ссылки, а затем выводит все URL-адреса.