Как парсить циан на Python?

Пользователь

krista

от krista , в категории: Python , 3 года назад

42 | 0

python

3 ответа

Пользователь

jaren

от jaren , 2 года назад

@krista

Для парсинга сайта ЦИАН на Python можно использовать библиотеку BeautifulSoup. Ниже приведен пример кода, который парсит данные о квартирах на сайте ЦИАН:

from bs4 import BeautifulSoup
import requests

# Отправляем GET-запрос на страницу с квартирами
url = "https://www.cian.ru/cat.php?deal_type=sale&engine_version=2&offer_type=flat&p=1"
response = requests.get(url)

# Создаем объект BeautifulSoup и указываем парсер
soup = BeautifulSoup(response.text, 'html.parser')

# Находим все объявления о квартирах на странице
apartments = soup.find_all('div', {'data-name': 'LinkArea'})

# Перебираем найденные объявления и вытаскиваем нужные данные
for apartment in apartments:
    title = apartment.find('div', {'class': '_93444fe79c--wrapper--E9jWb'}).text
    price = apartment.find('span', {'itemprop': 'price'}).text
    address = apartment.find('a', {'class': 'c6e8ba5398--address-links--1J5UM'}).text
    
    print("Title:", title)
    print("Price:", price)
    print("Address:", address)
    print("------------")

Вы можете изменить URL на нужный вам для получения данных о квартирах. В данном примере парсятся заголовок, цена и адрес каждой квартиры, но вы можете настроить код для парсинга других данных, если это нужно.

1 | 0

Пользователь

adrien.waters

от adrien.waters , 3 года назад

@krista

Чтобы спарсить циан на Python, вам может понадобиться использовать библиотеку Beautiful Soup. Это популярный инструмент для парсинга HTML и XML, который позволяет легко извлекать данные из веб-страниц.

Чтобы начать работу с Beautiful Soup, вам нужно установить библиотеку с помощью pip:

1	pip install beautifulsoup4

Затем вы можете импортировать библиотеку в свой код Python и начать использовать ее функции:

1	from bs4 import BeautifulSoup

Чтобы начать парсить циан, вам нужно будет сначала загрузить страницу. Вы можете сделать это, используя модуль requests:

import requests

url = 'https://example.com/page-to-parse.html'
page = requests.get(url)

Затем вы можете использовать Beautiful Soup, чтобы создать объект супа из HTML-кода страницы:

1	soup = BeautifulSoup(page.content, 'html.parser')

Теперь вы можете использовать функции Beautiful Soup, чтобы найти и извлечь нужные данные. Напри

2 | 0

Пользователь

francis_schuster

от francis_schuster , 2 года назад

@krista

Для парсинга сайта Циан на Python можно использовать модули requests и beautifulsoup4.

Вот пример кода, который осуществляет парсинг с использованием этих модулей:

import requests
from bs4 import BeautifulSoup

# Отправляем GET-запрос на страницу
url = "https://www.cian.ru"
response = requests.get(url)

# Проверяем статус ответа
if response.status_code == 200:
    # Создаем объект BeautifulSoup
    soup = BeautifulSoup(response.content, "html.parser")

    # Ищем нужные элементы на странице
    # Например, чтобы распарсить заголовки объявлений на главной странице:
    ads = soup.find_all("div", class_="c6e8ba5398--header--1fV2A") # пример класса заголовка объявления

    # Выводим найденные заголовки
    for ad in ads:
        print(ad.text)
else:
    print("Ошибка при отправке запроса")

Обратите внимание, что пример парсит только заголовки объявлений на главной странице. Вам нужно будет адаптировать код для вашей конкретной задачи и структуры страницы Циан.

0 | 0

Как парсить циан на Python?

3 ответа

Похожие обсуждения: