コマンドでpdfから画像ファイルを作成

Microsoft Windows コンピュータ
Microsoft Windows

以前に画像ファイルをアーカイブしたzipファイルをpdfに変換するスクリプトを書きました。調子に乗ってpdfへ変換していましたが、元のzipファイルに戻したくなりました。やり方は色々あるとは思いますがファイル数もそこそこありますのでスクリプトを使って一括処理をしたいと思います。
pdfファイルに埋め込まれた画像ファイルを抽出することも出来そうですが難しそうなので、pdfから画像ファイルを作成する方法を採用したいと思います。

それで今回お世話になるコマンドはpdftocairoです。

Windowsのバイナリは以下のサイトから頂戴してきます。
http://blog.alivate.com.au/poppler-windows/

ダウンロードした際のファイル名はpoppler-0.68.0_x86.7zでした。
あと日本語対応用のデータを以下のサイトから頂戴してきます。
Poppler-24.04.0

こちらのファイル名はpoppler-data-0.4.9.tar.gzでした。

ダウンロードしたファイルを展開します。まずWindowsバイナリを適当なディレクトリに配置し、日本語対応用のデータはディレクトリ名をpopplerに変更しshareディレクトリの下に放り込みます。
後はバイナリがあるディレクトリを環境変数のPATHに追加するのも良いでしょう。
ちなみに最近私はこの類のソフトを「C:\Users\ユーザー名」の下ににToolsというディレクトリを作りその下にソフトごとのディレクトリを作りインストールしています。

pdftocairo.exeでpdfファイルから画像ファイル作成してみます。

PS > pdftocairo.exe -jpeg ".\gomi.pdf" ".\gomi\a"

PS > ls ".\gomi"

Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2019/10/24 10:51 313255 a-01.jpg
-a---- 2019/10/24 10:51 280043 a-02.jpg
-a---- 2019/10/24 10:51 310258 a-03.jpg
-a---- 2019/10/24 10:51 306786 a-04.jpg
-a---- 2019/10/24 10:51 298476 a-05.jpg
-a---- 2019/10/24 10:51 291642 a-06.jpg
-a---- 2019/10/24 10:51 282586 a-07.jpg
-a---- 2019/10/24 10:51 289613 a-08.jpg
-a---- 2019/10/24 10:51 297995 a-09.jpg
-a---- 2019/10/24 10:51 286151 a-10.jpg
-a---- 2019/10/24 10:51 276111 a-11.jpg
-a---- 2019/10/24 10:51 291970 a-12.jpg
-a---- 2019/10/24 10:51 281838 a-13.jpg
-a---- 2019/10/24 10:51 283507 a-14.jpg
-a---- 2019/10/24 10:51 311222 a-15.jpg
-a---- 2019/10/24 10:51 303254 a-16.jpg
-a---- 2019/10/24 10:51 299464 a-17.jpg
-a---- 2019/10/24 10:51 283162 a-18.jpg
-a---- 2019/10/24 10:51 262151 a-19.jpg
-a---- 2019/10/24 10:51 295515 a-20.jpg
-a---- 2019/10/24 10:51 283620 a-21.jpg

.\gomi\aaがプレフィックスになりハイフンの後2桁の連番になっています。

他にもたくさんオプションがありますが、個人的にはこれだけ出来ればとりあえず良いです。

あとはこれをスクリプトに組み込むわけですが、とりあえず本日はここまで。

追記20230505
scoopからインストールすることもできます。

scoop install poppler

コメント