如何使用 Java 从 PDF 中提取图像

问题描述

如何使用 Java 从 PDF 中提取图像。

解决方案

以下是使用 Java 从 PDF 中提取图像的程序。

import java.awt.image.BufferedImage; 
import java.io.File; 

import javax.imageio.ImageIO; 
import org.apache.pdfbox.pdmodel.PDDocument; 
import org.apache.pdfbox.rendering.PDFRenderer;  

public class ExtractImageFromPdf {  
   public static void main(String args[]) throws Exception {  
      
        //加载现有 PDF 文档
        File file = new File("C:/pdfBox/ExtractImage_IP.pdf");
        PDDocument document = PDDocument.load(file);
        
        //实例化 PDFRenderer 类
        PDFRenderer renderer = new PDFRenderer(document);
        
        //从 PDF 文档渲染图像
        BufferedImage image = renderer.renderImage(0);
        
        //将图像写入文件
        ImageIO.write(image, "JPEG", new File("C:/pdfBox/ExtractImage_OP.png"));
        System.out.println("Image created");
        
        //关闭文档
        document.close();
   } 
}

输入

提取输入

输出

提取输出
java_apache_pdf_box.html