Как распарсить html в .net?

Пользователь

от rachel , в категории: Другие , 7 месяцев назад

Как распарсить html в .net?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от amaya_bahringer , 7 месяцев назад

@rachel 

В .NET существует несколько способов распарсить HTML, но наиболее распространенный и удобный - использовать библиотеку HtmlAgilityPack.


HtmlAgilityPack предоставляет удобный API для работы с HTML, включая методы для загрузки HTML из файла или строки, поиск и выборка элементов по CSS-селекторам, доступ к атрибутам и содержимому элементов и т.д.


Пример использования HtmlAgilityPack для парсинга HTML-страницы:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
using HtmlAgilityPack;

// Загрузить HTML-страницу из файла
var doc = new HtmlDo***ent();
doc.Load("page.html");

// Выбрать все элементы <a> с классом "link"
var links = doc.Do***entNode.SelectNodes("//a[@class='link']");

// Вывести текст и ссылку для каждой найденной ссылки
foreach (var link in links)
{
    Console.WriteLine("Text: {0}", link.InnerText);
    Console.WriteLine("URL: {0}", link.Attributes["href"].Value);
}


В этом примере мы загружаем HTML-страницу из файла, выбираем все элементы <a> с классом "link" и выводим текст и ссылку для каждой найденной ссылки.


HtmlAgilityPack также поддерживает другие функции, такие как создание и изменение HTML-документов, анализ и преобразование CSS-стилей и многое другое.