以前に画像ファイルをアーカイブしたzipファイルをpdfに変換するスクリプトを書きました。調子に乗ってpdfへ変換していましたが、元のzipファイルに戻したくなりました。やり方は色々あるとは思いますがファイル数もそこそこありますのでスクリプトを使って一括処理をしたいと思います。
pdfファイルに埋め込まれた画像ファイルを抽出することも出来そうですが難しそうなので、pdfから画像ファイルを作成する方法を採用したいと思います。
それで今回お世話になるコマンドはpdftocairoです。
Windowsのバイナリは以下のサイトから頂戴してきます。
ダウンロードした際のファイル名は
http://blog.alivate.com.au/poppler-windows/
ダウンロードした際のファイル名は
poppler-0.68.0_x86.7z
でした。ダウンロードしたファイルを展開します。まずWindowsバイナリを適当なディレクトリに配置し、日本語対応用のデータはディレクトリ名をpoppler
に変更しshare
ディレクトリの下に放り込みます。
後はバイナリがあるディレクトリを環境変数のPATHに追加するのも良いでしょう。
ちなみに最近私はこの類のソフトを「C:\Users\ユーザー名
」の下ににTools
というディレクトリを作りその下にソフトごとのディレクトリを作りインストールしています。
pdftocairo.exe
でpdfファイルから画像ファイル作成してみます。
PS > pdftocairo.exe -jpeg ".\gomi.pdf" ".\gomi\a"
PS > ls ".\gomi"
Mode LastWriteTime Length Name
---- ------------- ------ ----
-a---- 2019/10/24 10:51 313255 a-01.jpg
-a---- 2019/10/24 10:51 280043 a-02.jpg
-a---- 2019/10/24 10:51 310258 a-03.jpg
-a---- 2019/10/24 10:51 306786 a-04.jpg
-a---- 2019/10/24 10:51 298476 a-05.jpg
-a---- 2019/10/24 10:51 291642 a-06.jpg
-a---- 2019/10/24 10:51 282586 a-07.jpg
-a---- 2019/10/24 10:51 289613 a-08.jpg
-a---- 2019/10/24 10:51 297995 a-09.jpg
-a---- 2019/10/24 10:51 286151 a-10.jpg
-a---- 2019/10/24 10:51 276111 a-11.jpg
-a---- 2019/10/24 10:51 291970 a-12.jpg
-a---- 2019/10/24 10:51 281838 a-13.jpg
-a---- 2019/10/24 10:51 283507 a-14.jpg
-a---- 2019/10/24 10:51 311222 a-15.jpg
-a---- 2019/10/24 10:51 303254 a-16.jpg
-a---- 2019/10/24 10:51 299464 a-17.jpg
-a---- 2019/10/24 10:51 283162 a-18.jpg
-a---- 2019/10/24 10:51 262151 a-19.jpg
-a---- 2019/10/24 10:51 295515 a-20.jpg
-a---- 2019/10/24 10:51 283620 a-21.jpg
.\gomi\a
のa
がプレフィックスになりハイフンの後2桁の連番になっています。
他にもたくさんオプションがありますが、個人的にはこれだけ出来ればとりあえず良いです。
あとはこれをスクリプトに組み込むわけですが、とりあえず本日はここまで。
追記20230505
scoopからインストールすることもできます。
scoop install poppler
コメント