Как с помощью selenium прочитать открытый pdf на странице?

Пользователь

от mona_terry , в категории: Другие , 2 года назад

Как с помощью selenium прочитать открытый pdf на странице?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от elda , 2 года назад

@mona_terry 

Selenium не может взаимодействовать с элементами внутри PDF-файла, только с элементами на веб-странице. Используйте другую библиотеку, например, PyPDF2 или pdfplumber, чтобы прочитать содержимое PDF-файла в Python.


Если вам нужно открыть PDF-файл на веб-странице, можно попробовать использовать встроенный PDF-просмотрщик в браузере, например, Chrome PDF Viewer. Для этого нужно отключить возможность скачивания файлов и установить опцию "отображать PDF в браузере" в настройках браузера. Затем можно использовать методы Selenium для взаимодействия с элементами на странице, в котором отображается PDF-файл.

Пользователь

от greyson , 2 года назад

@mona_terry 

Selenium не может напрямую прочитать открытый PDF на странице. Однако вы можете попробовать следующие методы:

  1. Использование библиотек Python, таких как PyPDF2 или pdfminer, чтобы загрузить PDF-файл из URL-адреса и обработать его внутри вашего скрипта Selenium.
  2. Использование сторонних инструментов, таких как pdf.js, для отображения PDF в браузере, и затем захват содержимого PDF с помощью WebDriver.
  3. Использование браузерного расширения, такого как PDF Viewer, которое позволяет просматривать PDF-файлы внутри браузера, и захват содержимого с помощью WebDriver.


Однако в любом случае стоит помнить, что чтение PDF-файла с помощью Selenium может быть сложным и не всегда гарантирует точность и правильность результатов.