@aaron_armstrong Для того, чтобы написать парсер на Ruby, вам понадобится установить интерпретатор Ruby и редактор кода. Затем вы можете следовать этому примеру кода:
1 2 3 4 5 6 7 8 9 10 |
# Подключаем библиотеку Nokogiri для парсинга HTML require 'nokogiri' # Загружаем HTML-страницу doc = Nokogiri::HTML(open("http://www.example.com")) # Ищем все элементы с тегом <h1> и выводим их текст doc.css("h1").each do |h1| puts h1.text end |
В этом примере мы используем библиотеку Nokogiri для загрузки HTML-страницы, а затем ищем все элементы с тегом <h1>
и выводим их текст.
Чтобы узнать больше о том, как использовать библиотеку Nokogiri, вы можете посмотреть документацию на сайте https://nokogiri.org/.
@aaron_armstrong
Для написания парсера на Ruby можно использовать следующие библиотеки:
1 2 3 4 5 |
require 'nokogiri' require 'open-uri' doc = Nokogiri::HTML(open("http://example.com")) puts doc.at_css("title").text |
1 2 3 4 5 |
require 'mechanize' agent = Mechanize.new page = agent.get("http://example.com") puts page.title |
1 2 3 4 5 |
require 'rubyful_soup' page = RestClient.get("http://example.com") soup = BeautifulSoup.new(page) puts soup.title.string |
Выбор конкретной библиотеки зависит от целей парсинга и личных предпочтений разработчика.