ImageMagickでPDFをJPGに変換
CMYKのPDFをRGBのJPG画像に変換するのはImageMagickの以下のオプションをつければOKだった。
・解像度 -density とその単位 -units
→300ppi
・JPEG品質 -quality
→高画質 90
・4色のカラープロファイル -profile
→「JapanColor2001Coated.icc」を指定すればほぼ問題ない、はず。
・カラーモード -colorspace
→cmyk
・rgbのカラープロファイル -profile
→「sRGB_v4_ICC_preference.icc」と他ので差はなかった、かな。
・カラーモード -colorspace
→srgb
convert
-density 300 -units PixelsPerInch
-quality 90
-profile JapanColor2001Coated.icc
-colorspace cmyk
-profile sRGB_v4_ICC_preference.icc
-colorspace srgb
input.pdf output.jpg
上記をコマンドラインに一行で書いて実行すれば、複数ページあるinput.pdfを、連番がついたRGBのJPEG画像(output-0.jpg output-1.jpg)に変換してくれる。
プロファイルは以下のサイトからダウンロードできる(Macはrgbのプロファイルがシステムに入っている)
「ICCプロファイルダウンロード」
https://japancolor.jp/icc_download.html
「lnternational Color Consortium」
https://www.color.org/srgbprofiles.xalter
↑変換後の画像の一部(100%表示)。このぐらい文字がしっかりしてれば問題はない。
フォトショップでもPDFからJPEGに変換してみたけど、品質的に変わりはなかった。
(アクションを組めばフォトショップでも一括処理ができそう。…あ、フォトショて複数ページのPDFを全ページ一度に読みこめるんだっけか)
ついでにimagemagickのconvertのパラメータを検索したのでメモ。
サイズ変更
-resize と -geometry と -scale の3つ。この中では
-scale 1024x
の精度が高いらしい。同じことをするのになんでまた3つもオプションがあるんだろう。きっと何か意味があるんだろうなあ。
レベル補正
-level 20%,80%
↑山の両端を切り落とし
おまかせレベル補正
-auto-level
アンシャープ、シャープ
-unsharp 4x4+0.5+0
-sharpen 5
↑unsharpのパラメータはよくわからんので実際に数値を変えて、目で見ながらという地味な作業かも。
毎度のことながらimagemagickを使うたびにオプションやパラメータを探しまくり。imagemagickはオプションもパラメータもてんこ盛り。でもって、ネットの二次情報はオプションを間違えたまま掲載ということも…って、これだけどっさりオプションがあったらしかたがないわなあ。
ちなみに、プロファイルは各々どれを使ってもあまり差は感じられなかった…のは元のPDFの作りのせいだろう。
画像処理は負荷が大きいようで、DELLのWINDOWS7ネットブックは、変換のためにコマンドラインでエンターキーを叩いたらひーひー言いながらなかなか戻ってこなかった。EPUBファイルの制作はこのネットブックでやってるんだけど、変換処理だけは別のパソコンでやったほうがいい、か。うーむ。
[2016/06/11 10:15:20] 追記。
PDFをjpg画像に変換すると背景が真っ黒になってしまうファイルがある。
PDFなどの透明部分が黒になってしまうらしい。
オプションを追加することで背景を白にできる。
-alpha Remove
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
utfのトラブルも糞エクセルが…
帰り際にトラブル。…って、なんで utf のファイルが文字化けてんだよ。utf基本のサイトで。設定ファイルを、utfも理解できない低能糞エクセルなんぞでいつまでもつけてるからこんな腐ったことになるんだ。おまけに設定ファイルを読み込んだページはキャッシュがきくので、設定ファイルをsjisにして流し込み直してアクセスしてもキャッシュを返すだけ。全部でン台あるwebサーバーのキャッシュを殺さないとまずい。なのに、当然sambaで読み書きできない。rootでrsyncで、ということになるんだけど、まさか週末のかき入れ時にすべてのページのキャッシュを消すなんてできない。必死で該当ページのキャッシュを見つけてなんとかしのいでこんな時間だ。
って、utfのcsv設定ファイルを無造作にほうり込んだのは、誰でもない、わたしなんだけどね。しょぼ。しかし、やっぱりここでも糞エクセルかよ、と逆ギレる。
ふだん、自分がエディタで作業してるから、というかパソコンを触ってるというよりエディタを使ってる、という状態なもんで、つい誰もがそうだろうと思ってたり。エクセルを普通に使うならエディタなんてもっと普通に使えるだろうと思ったらそうでもないのでちょっと驚いた。実際プログラマでもないひとはエディタを使う方が少ないのかもしれん。わたしはプログラマじゃないけど、古巣で仕事柄ネーム書きすることが多くて、パソコンイコール文章書きのための機械。世間一般、というか普通のひとは、パソコンってのは、エクセルやその他のアプリのための機械でインターネットするための機械。
たぶんパソコンにしてみれば、そうした使われ方が本望だよなあ。おれはたんなる文字打ちのための道具じゃねえぞ、と。エディタなんて野蛮なもの使ってんじゃねえぞ、と。
なんかなあ。エクセルのないところにいきたいぜ。今のわたしの不幸の97%はふぁっきんエクセルが原因だし、蒸し暑いのも電車が遅れるのもエクセルが悪い。ちくそお。ちかりたよ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」