Как открыть pdf в Java?

Пользователь

от jeromy_ruecker , в категории: Java , 2 года назад

Как открыть pdf в Java?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от catherine_wintheiser , год назад

@jeromy_ruecker 

Чтобы открыть PDF в Java, можно использовать библиотеку Apache PDFBox. Она предоставляет набор классов для чтения, записи, аннотирования и манипулирования PDF-документами.


Ниже приведен пример кода, который открывает PDF-файл и выводит его содержимое в консоль:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.File;
import java.io.IOException;

public class Main {
    public static void main(String[] args) {
        // Открываем PDF-файл
        File file = new File("file.pdf");
        PDDocument document = PDDocument.load(file);

        // Извлекаем текст из PDF-файла
        PDFTextStripper stripper = new PDFTextStripper();
        String text = stripper.getText(document);

        // Выводим текст в консоль
        System.out.println(text);

        // Закрываем PDF-документ
        document.close();
    }
}


Чтобы использовать Apache PDFBox, нужно добавить зависимость в ваш проект. В Maven-проекте это можно сделать с помощью следующей строки в секции dependencies файла pom.xml:

1
2
3
4
5
<dependency>
  <groupId>org.apache.pdfbox</groupId>
  <artifactId>pdfbox</artifactId>
  <version>2.0.24</version>
</dependency>


В Gradle-проекте зависимость можно добавит

Пользователь

от jazmyne , год назад

@jeromy_ruecker 

В Java существует несколько способов открытия PDF-файлов. Один из самых простых способов - использование библиотеки iText для чтения и обработки PDF-файлов.


Вот пример кода, который позволяет открыть PDF-файл с помощью библиотеки iText:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import com.itextpdf.text.Document;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.PdfTextExtractor;

import java.io.File;

public class PDFReader {
    public static void main(String[] args) {
        try {
            // Создаем объект класса PdfReader
            PdfReader reader = new PdfReader(new File("file.pdf").getAbsolutePath());
            
            // Создаем объект класса Document для хранения извлеченного текста
            Document document = new Document();
            
            // Проходим по всем страницам PDF-файла и извлекаем текст
            for (int i = 1; i <= reader.getNumberOfPages(); i++) {
                String text = PdfTextExtractor.getTextFromPage(reader, i);
                document.add(new Paragraph(text));
            }
            
            // Закрываем ридер и документ
            reader.close();
            document.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}


Этот код создает объект PdfReader для чтения PDF-файла и объект Document для хранения извлеченного текста. Затем он проходит по всем страницам PDF-файла и извлекает текст, который добавляется в объект Document. После завершения процесса извлечения текста ридер и документ закрываются.


Это простой пример, который можно доработать и расширить в соответствии с конкретными потребностями. Также существует множество других библиотек для работы с PDF-файлами в Java, которые могут быть использованы в зависимости от конкретных требований.