@krista
Для парсинга сайта ЦИАН на Python можно использовать библиотеку BeautifulSoup. Ниже приведен пример кода, который парсит данные о квартирах на сайте ЦИАН:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
from bs4 import BeautifulSoup import requests # Отправляем GET-запрос на страницу с квартирами url = "https://www.cian.ru/cat.php?deal_type=sale&engine_version=2&offer_type=flat&p=1" response = requests.get(url) # Создаем объект BeautifulSoup и указываем парсер soup = BeautifulSoup(response.text, 'html.parser') # Находим все объявления о квартирах на странице apartments = soup.find_all('div', {'data-name': 'LinkArea'}) # Перебираем найденные объявления и вытаскиваем нужные данные for apartment in apartments: title = apartment.find('div', {'class': '_93444fe79c--wrapper--E9jWb'}).text price = apartment.find('span', {'itemprop': 'price'}).text address = apartment.find('a', {'class': 'c6e8ba5398--address-links--1J5UM'}).text print("Title:", title) print("Price:", price) print("Address:", address) print("------------") |
Вы можете изменить URL на нужный вам для получения данных о квартирах. В данном примере парсятся заголовок, цена и адрес каждой квартиры, но вы можете настроить код для парсинга других данных, если это нужно.
@krista
Чтобы спарсить циан на Python, вам может понадобиться использовать библиотеку Beautiful Soup. Это популярный инструмент для парсинга HTML и XML, который позволяет легко извлекать данные из веб-страниц.
Чтобы начать работу с Beautiful Soup, вам нужно установить библиотеку с помощью pip:
1
|
pip install beautifulsoup4 |
Затем вы можете импортировать библиотеку в свой код Python и начать использовать ее функции:
1
|
from bs4 import BeautifulSoup |
Чтобы начать парсить циан, вам нужно будет сначала загрузить страницу. Вы можете сделать это, используя модуль requests:
1 2 3 4 |
import requests url = 'https://example.com/page-to-parse.html' page = requests.get(url) |
Затем вы можете использовать Beautiful Soup, чтобы создать объект супа из HTML-кода страницы:
1
|
soup = BeautifulSoup(page.content, 'html.parser') |
Теперь вы можете использовать функции Beautiful Soup, чтобы найти и извлечь нужные данные. Напри
@krista
Для парсинга сайта Циан на Python можно использовать модули requests
и beautifulsoup4
.
Вот пример кода, который осуществляет парсинг с использованием этих модулей:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
import requests from bs4 import BeautifulSoup # Отправляем GET-запрос на страницу url = "https://www.cian.ru" response = requests.get(url) # Проверяем статус ответа if response.status_code == 200: # Создаем объект BeautifulSoup soup = BeautifulSoup(response.content, "html.parser") # Ищем нужные элементы на странице # Например, чтобы распарсить заголовки объявлений на главной странице: ads = soup.find_all("div", class_="c6e8ba5398--header--1fV2A") # пример класса заголовка объявления # Выводим найденные заголовки for ad in ads: print(ad.text) else: print("Ошибка при отправке запроса") |
Обратите внимание, что пример парсит только заголовки объявлений на главной странице. Вам нужно будет адаптировать код для вашей конкретной задачи и структуры страницы Циан.