PDFBox轉圖片小工具

1. 效果

(1)轉換pdf所有頁面:

# 運行
java -jar pdftransfer-1.0.jar D:\test\mypdflocation\文件.pdf
轉化pdf所有頁面.png

轉化結果.png

(2)轉化指定頁面

# 運行,注意第二個參數,代表頁面號,多個頁面用空格隔開
java -jar pdftransfer-1.0.jar D:\test\mypdflocation\文件.pdf 5 6 7
轉化指定頁面.png
image.png

2. 源碼

JDK:
建議1.8

maven依賴:

<dependency>
       <groupId>com.levigo.jbig2</groupId>
       <artifactId>levigo-jbig2-imageio</artifactId>
       <version>2.0</version>
</dependency>
<dependency>
       <groupId>com.twelvemonkeys.imageio</groupId>
       <artifactId>imageio-jpeg</artifactId>
       <version>3.4.1</version>
</dependency>
<dependency>
       <groupId>org.apache.pdfbox</groupId>
       <artifactId>pdfbox</artifactId>
       <version>2.0.17</version>
</dependency>
<dependency>
       <groupId>com.github.jai-imageio</groupId>
       <artifactId>jai-imageio-core</artifactId>
       <version>1.4.0</version>
</dependency>
<dependency>
      <groupId>com.github.jai-imageio</groupId>
      <artifactId>jai-imageio-jpeg2000</artifactId>
      <version>1.3.0</version>
</dependency>

文件源碼

package com.qzh;

import org.apache.pdfbox.cos.COSObject;
import org.apache.pdfbox.pdmodel.DefaultResourceCache;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.graphics.PDXObject;
import org.apache.pdfbox.rendering.PDFRenderer;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.EOFException;
import java.io.File;
import java.io.IOException;
import java.io.Serializable;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;
import java.util.concurrent.*;

/**
 * 參數1:路徑
 * 參數2:指定頁數
 *
 * @author qu.zh
 * @date 2019/12/11 17:24
 */
public class PdfTransfer {

    private static String FILE_NAME = "";

    /**
     * 文件輸出路徑
     */
    private static String FILE_OUTPUT_PATH = "d:/pdf/output/";

    /**
     * 隊列
     */
    private volatile static ArrayBlockingQueue<DataEntity> queue = new ArrayBlockingQueue<DataEntity>(500);

    /**
     * CPU核心線程數
     */
    private static final int CPU_CORE = 7;

    /**
     * 默認DPI,可以用參數進行擴展
     */
    private static final int DEFAULT_DPI = 400;


    static {
        System.setProperty("sun.java2d.cmm", "sun.java2d.cmm.kcms.KcmsServiceProvider");
    }

    public static void main(String[] args) {
        // pdf名稱
        if (args == null || args.length == 0) {
            System.err.println("請傳入路徑");
            return;
        }
        String name = args[0];

        List<Integer> needTransferList = new ArrayList<>();
        if (args.length > 1) {
            for (int i = 1; i < args.length; i++) {
                needTransferList.add(Integer.valueOf(args[i]));
                System.out.println("打印頁數:" + args[i]);
            }
        }

        FILE_NAME = name;

        if (FILE_NAME == null || "".equals(FILE_NAME)) {
            System.err.println("pdf名稱不能為空");
            return;
        }


        ThreadPoolExecutor executor = new ThreadPoolExecutor(CPU_CORE, CPU_CORE,
                1200, TimeUnit.SECONDS, new SynchronousQueue<>(), new ThreadPoolExecutor.CallerRunsPolicy());
        // i7+16G+8核的機器
        // 20進程 62秒
        // 14進程 46秒
        // 10進程 44秒
        // 8進程  40秒
        // 6進程  42秒
        // 4線程  49秒
        // 趨近核數最快
        for (int i = 0; i < CPU_CORE; i++) {
            executor.submit(new MyTask(queue));
        }

        File file = new File(FILE_NAME);
        int end = file.getName().lastIndexOf(".");
        String folderName = file.getName().substring(0, end);
        File fileParent = new File(file.getParent());
        if (!fileParent.exists()) {
            file.mkdirs();
        }

        FILE_OUTPUT_PATH = FILE_OUTPUT_PATH + File.separator + folderName + File.separator;
        File output = new File(FILE_OUTPUT_PATH);
        if (!output.exists()) {
            output.mkdirs();
        }


        PDDocument pdDocument = null;
        try {
            Date startDate = new Date();
            System.out.println();
            pdDocument = PDDocument.load(new File(FILE_NAME));

            pdDocument.setResourceCache(new MyResourceCache());
            int pageCount = pdDocument.getNumberOfPages();

            PDFRenderer renderer = new PDFRenderer(pdDocument);
            CountDownLatch countDownLatch = new CountDownLatch(needTransferList.size() > 0 ? needTransferList.size() : pageCount);
            System.out.println("轉換頁數頁數一共:" + needTransferList.size());
            if (needTransferList.size() > 0) {
                for (int i = 0; i < needTransferList.size(); i++) {
                    int curPage = needTransferList.get(i);
                    DataEntity dataEntity = new DataEntity();
                    dataEntity.setPageNum(curPage - 1);
                    dataEntity.setPdfRenderer(renderer);
                    dataEntity.setCountDownLatch(countDownLatch);
                    dataEntity.setPageCount(pageCount);
                    queue.put(dataEntity);
                }
            } else {
                for (int j = 0; j < pageCount; j++) {
                    DataEntity dataEntity = new DataEntity();
                    dataEntity.setPageNum(j);
                    dataEntity.setPdfRenderer(renderer);
                    dataEntity.setCountDownLatch(countDownLatch);
                    dataEntity.setPageCount(pageCount);
                    int imageCount = 0;

                    int fontCount = 0;
                    // 圖片內容
                    PDPage page = pdDocument.getPage(j);
                    PDResources resources = page.getResources();
                    Iterable<COSName> cosNames = resources.getXObjectNames();
                    BufferedImage bufferedImage = null;
                    if (cosNames != null) {
                        Iterator<COSName> cosNamesIter = cosNames.iterator();
                        while (cosNamesIter.hasNext()) {
                            COSName cosName = cosNamesIter.next();
                            PDFont font = resources.getFont(cosName);
                            if (resources.isImageXObject(cosName)) {
                                imageCount++;
                                PDImageXObject Ipdmage = (PDImageXObject) resources.getXObject(cosName);
                                bufferedImage = Ipdmage.getImage();

                            }
                            if (font != null) {
                                fontCount++;
                            }
                        }
                    }
                   // 如果每一頁只有一張圖片,直接提出來就行,不然效率低
                    if (fontCount == 0 && imageCount == 1) {
                        String imageFileName = FILE_OUTPUT_PATH + "number_" + (j + 1) + "_page.png";
                        FileOutputStream out = new FileOutputStream(imageFileName);
                        try {
                            ImageIO.write(bufferedImage, "png", out);
                        } catch (IOException e) {
                        } finally {
                            try {
                                out.close();
                            } catch (IOException e) {
                                e.printStackTrace();
                            }
                        }
                    } else {
                        queue.put(dataEntity);
                    }
                }
            }

            countDownLatch.await(200, TimeUnit.SECONDS);
            System.out.println("執行完畢!!!!!!!!!");
            System.out.println("頁數:" + pageCount);
            Date endDate = new Date();
            System.out.println("用時:" + (endDate.getTime() - startDate.getTime()) / 1000 + "秒");

        } catch (IOException e) {
            e.printStackTrace();
            System.err.println("IOException");
        } catch (InterruptedException e) {
            e.printStackTrace();
            System.err.println("InterruptedException");
        } catch (Throwable throwable) {
            throwable.printStackTrace();
        } finally {
            try {
                if (pdDocument != null) {
                    pdDocument.close();
                }
            } catch (IOException e) {
                e.printStackTrace();
                System.err.println("IOException");
            }
        }
        System.out.println("按ctrl+c結束");
    }

    /**
     * 緩存優化,官網說這個指定為空會禁止使用緩存
     */
    private static class MyResourceCache extends DefaultResourceCache {
        @Override
        public void put(COSObject indirect, PDXObject xobject) throws IOException {
            // super .put(indirect,xobject);
        }
    }

    /**
     * 任務
     */
    public static class MyTask implements Runnable {

        private ArrayBlockingQueue<DataEntity> queue;

        public MyTask(ArrayBlockingQueue queue) {
            this.queue = queue;
        }

        @Override
        public void run() {
            while (true) {
                DataEntity dataEntity = null;
                BufferedImage image = null;
                try {
                    // 取出任務
                    dataEntity = queue.take();
                    PDFRenderer renderer = dataEntity.getPdfRenderer();
                    int pageNum = dataEntity.getPageNum();
                    String imageFileName = FILE_OUTPUT_PATH + "第" + (pageNum + 1) + "頁.png";
                    // 進行轉圖片
                    System.out.println("============第" + (pageNum + 1) + "頁轉換中============");

                    // renderer是不安全的,所以得加鎖,雖然會影響性能
                    synchronized (renderer) {
                        image = renderer.renderImageWithDPI(pageNum, DEFAULT_DPI);
                    }

                    ImageIO.write(image, "png", new File(imageFileName));
                } catch (InterruptedException e) {
                    e.printStackTrace();
                    System.err.println("InterruptedException==========");
                } catch (IOException e) {
                    if (e instanceof EOFException) {
                        System.err.println("EOFException========");
                    } else {
                        System.err.println("IOException========");
                        e.printStackTrace();
                    }


                } catch (Exception throwable) {
                    System.out.println("=================Throwable==========================");
                    throwable.printStackTrace();
                } finally {
                    if (image != null) {
                        image.flush();
                    }

                    if (dataEntity != null) {
                        CountDownLatch countDownLatch = dataEntity.getCountDownLatch();
                        countDownLatch.countDown();
                    }
                }
            }
        }
    }

    /**
     * 任務實體
     */
    private static class DataEntity implements Serializable {
        public static final long serialVersionUID = -1;
        private PDFRenderer pdfRenderer;

        private int pageNum;

        private CountDownLatch countDownLatch;

        private int pageCount;

        public int getPageCount() {
            return pageCount;
        }

        public void setPageCount(int pageCount) {
            this.pageCount = pageCount;
        }

        public PDFRenderer getPdfRenderer() {
            return pdfRenderer;
        }

        public CountDownLatch getCountDownLatch() {
            return countDownLatch;
        }

        public void setCountDownLatch(CountDownLatch countDownLatch) {
            this.countDownLatch = countDownLatch;
        }

        public void setPdfRenderer(PDFRenderer pdfRenderer) {
            this.pdfRenderer = pdfRenderer;
        }

        public int getPageNum() {
            return pageNum;
        }

        public void setPageNum(int pageNum) {
            this.pageNum = pageNum;
        }
    }
}



如果需要指定main執行的話:

<build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-assembly-plugin</artifactId>
                <version>2.3</version>
                <configuration>
                    <appendAssemblyId>false</appendAssemblyId>
                    <descriptorRefs>
                        <descriptorRef>jar-with-dependencies</descriptorRef>
                    </descriptorRefs>
                    <archive>
                        <manifest>
                            <addClasspath>true</addClasspath>
                            <classpathPrefix>lib/</classpathPrefix>
                            <mainClass>com.qzh.PdfTransfer</mainClass>
                        </manifest>
                    </archive>
                </configuration>
                <executions>
                    <execution>
                        <id>make-assembly</id>
                        <phase>package</phase>
                        <goals>
                            <goal>assembly</goal>
                        </goals>
                    </execution>
                </executions>
            </plugin>
        </plugins>
    </build>

3. 說明

(1)核心線程數可以根據實際環境來調整,建議為cpu核數(加一或者減一)。
(2)出現其他問題請參考:http://www.lxweimin.com/p/c85017f8577a

image.png

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,572評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,071評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,409評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,569評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,360評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,895評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,979評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,123評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,643評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,559評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,742評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,250評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,981評論 3 346
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,363評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,622評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,354評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,707評論 2 370