Как парсить картинки с сайтов на python?

Пользователь

от gussie.jones , в категории: Python , 3 года назад

Как парсить картинки с сайтов на python?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от NicolasSsh , 3 года назад

@gussie.jones  Вы можете использовать библиотеку BeautifulSoup и requests для парсинга картинок с сайтов.


 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
import requests
from bs4 import BeautifulSoup

def get_html(url : str):
    return requests.get(url).text # Делаем запрос и возвращаем его содержимое

def get_image_from_html(html : str):
    soup = BeautifulSoup(html, 'html.parser') # Создаем экземпляр класса beautifulsoup с режимом 'html.parser'

    image = soup.find('img', {'class' : 'some_image'}).get('href') # Получаем изображение с классом some_image

    return image

if __name__ == '__main__':
    html = get_html(url = "dropcode.ru")
    image = get_image_from_html(html = html) # Получаем изображение

Пользователь

от gage , 2 года назад

@gussie.jones 

Для парсинга картинок с сайтов в Python можно использовать библиотеку requests для загрузки HTML-страницы и библиотеку beautifulsoup для поиска ссылок на картинки.

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
import requests
from bs4 import BeautifulSoup

# Загрузка HTML-страницы
url = 'https://example.com'
response = requests.get(url)
html = response.content

# Использование BeautifulSoup для поиска ссылок на картинки
soup = BeautifulSoup(html, 'html.parser')
images = [img.get('src') for img in soup.find_all('img')]

# Загрузка каждой картинки
for image in images:
    image_url = url + image
    image_response = requests.get(image_url)
    open(image.split('/')[-1], 'wb').write(image_response.content)