Как парсить циан на Python?

Пользователь

от krista , в категории: Python , 2 года назад

Как парсить циан на Python?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

3 ответа

Пользователь

от jaren , 9 месяцев назад

@krista 

Для парсинга сайта ЦИАН на Python можно использовать библиотеку BeautifulSoup. Ниже приведен пример кода, который парсит данные о квартирах на сайте ЦИАН:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
from bs4 import BeautifulSoup
import requests

# Отправляем GET-запрос на страницу с квартирами
url = "https://www.cian.ru/cat.php?deal_type=sale&engine_version=2&offer_type=flat&p=1"
response = requests.get(url)

# Создаем объект BeautifulSoup и указываем парсер
soup = BeautifulSoup(response.text, 'html.parser')

# Находим все объявления о квартирах на странице
apartments = soup.find_all('div', {'data-name': 'LinkArea'})

# Перебираем найденные объявления и вытаскиваем нужные данные
for apartment in apartments:
    title = apartment.find('div', {'class': '_93444fe79c--wrapper--E9jWb'}).text
    price = apartment.find('span', {'itemprop': 'price'}).text
    address = apartment.find('a', {'class': 'c6e8ba5398--address-links--1J5UM'}).text
    
    print("Title:", title)
    print("Price:", price)
    print("Address:", address)
    print("------------")


Вы можете изменить URL на нужный вам для получения данных о квартирах. В данном примере парсятся заголовок, цена и адрес каждой квартиры, но вы можете настроить код для парсинга других данных, если это нужно.

Пользователь

от adrien.waters , год назад

@krista 

Чтобы спарсить циан на Python, вам может понадобиться использовать библиотеку Beautiful Soup. Это популярный инструмент для парсинга HTML и XML, который позволяет легко извлекать данные из веб-страниц.


Чтобы начать работу с Beautiful Soup, вам нужно установить библиотеку с помощью pip:

1
pip install beautifulsoup4


Затем вы можете импортировать библиотеку в свой код Python и начать использовать ее функции:

1
from bs4 import BeautifulSoup


Чтобы начать парсить циан, вам нужно будет сначала загрузить страницу. Вы можете сделать это, используя модуль requests:

1
2
3
4
import requests

url = 'https://example.com/page-to-parse.html'
page = requests.get(url)


Затем вы можете использовать Beautiful Soup, чтобы создать объект супа из HTML-кода страницы:

1
soup = BeautifulSoup(page.content, 'html.parser')


Теперь вы можете использовать функции Beautiful Soup, чтобы найти и извлечь нужные данные. Напри

Пользователь

от francis_schuster , 9 месяцев назад

@krista 

Для парсинга сайта Циан на Python можно использовать модули requests и beautifulsoup4.


Вот пример кода, который осуществляет парсинг с использованием этих модулей:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
import requests
from bs4 import BeautifulSoup

# Отправляем GET-запрос на страницу
url = "https://www.cian.ru"
response = requests.get(url)

# Проверяем статус ответа
if response.status_code == 200:
    # Создаем объект BeautifulSoup
    soup = BeautifulSoup(response.content, "html.parser")

    # Ищем нужные элементы на странице
    # Например, чтобы распарсить заголовки объявлений на главной странице:
    ads = soup.find_all("div", class_="c6e8ba5398--header--1fV2A") # пример класса заголовка объявления

    # Выводим найденные заголовки
    for ad in ads:
        print(ad.text)
else:
    print("Ошибка при отправке запроса")


Обратите внимание, что пример парсит только заголовки объявлений на главной странице. Вам нужно будет адаптировать код для вашей конкретной задачи и структуры страницы Циан.