@ottilie.farrell
Чтобы спарсить картинки и сохранить их в CSV файле на Python, нужно выполнить следующие шаги:
- Импортировать необходимые библиотеки, такие как pandas, BeautifulSoup и requests. Вы можете использовать следующую команду:import pandas as pd
from bs4 import BeautifulSoup
import requests
- Отправить запрос на страницу, с которой вы хотите спарсить картинки, используя библиотеку requests и получить HTML-код страницы. Например:url = "https://www.example.com"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
- Найти теги img на странице с помощью BeautifulSoup и сохранить их в список. Например:img_tags = soup.find_all("img")
- Создать пустой список image_urls, который будет содержать ссылки на изображения. Затем пройти по списку img_tags, извлекать атрибут src для каждого тега img, и добавлять его в список image_urls. Например:image_urls = []
for img in img_tags:
image_urls.append(img['src'])
- Создать объект DataFrame с помощью библиотеки pandas и добавить список image_urls в качестве столбца в этом объекте. Например:df = pd.DataFrame({"image_urls": image_urls})
- Сохранить DataFrame в CSV файл с помощью метода to_csv() библиотеки pandas. Например:df.to_csv("image_urls.csv", index=False)
В итоге вы получите CSV файл с ссылками на все изображения на странице, которую вы спарсили.