Как парсить текст с сайта на python?

Пользователь

от gage , в категории: Python , 2 месяца назад

Как парсить текст с сайта на python?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от NicolasSsh , 2 месяца назад

@gage  Вы можете парсить текст с сайта с помощью библиотек BeautifulSoup и requests


 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
import requests
from bs4 import BeautifulSoup

def get_html(url : str) -> str:
    response = requests.get(url) # Делаем запрос

    return response.text # Возвращаем html-документ

def parse_html(html : str) -> str:
    soup = BeautifulSoup(html, 'html.parser') # Создаем объект класса BeautifulSoup с режимом "html.parser"

    text = soup.find('div', {'class' : 'some-class'}).get_text() # Парсим текст по тегу div и классу "some-class"

    return text # Возвращаем полученные данные

if __name__ == "__main__":
    html = get_html("https://dropcode.ru")
    text = parse_html(html = html)
    
    print(text)