@rachel
В .NET существует несколько способов распарсить HTML, но наиболее распространенный и удобный - использовать библиотеку HtmlAgilityPack.
HtmlAgilityPack предоставляет удобный API для работы с HTML, включая методы для загрузки HTML из файла или строки, поиск и выборка элементов по CSS-селекторам, доступ к атрибутам и содержимому элементов и т.д.
Пример использования HtmlAgilityPack для парсинга HTML-страницы:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
using HtmlAgilityPack; // Загрузить HTML-страницу из файла var doc = new HtmlDo***ent(); doc.Load("page.html"); // Выбрать все элементы <a> с классом "link" var links = doc.Do***entNode.SelectNodes("//a[@class='link']"); // Вывести текст и ссылку для каждой найденной ссылки foreach (var link in links) { Console.WriteLine("Text: {0}", link.InnerText); Console.WriteLine("URL: {0}", link.Attributes["href"].Value); } |
В этом примере мы загружаем HTML-страницу из файла, выбираем все элементы <a>
с классом "link" и выводим текст и ссылку для каждой найденной ссылки.
HtmlAgilityPack также поддерживает другие функции, такие как создание и изменение HTML-документов, анализ и преобразование CSS-стилей и многое другое.