epub3電子書籍制作作業メモ

2024/11/28 [10:22:32] (木) 天気

今やってるepub3電子書籍制作仕事、というか作業に使ってるperlスクリプト類のメモ。

どのクライアントさんも、元データをいただいて、こちらでepub3ファイルに梱包するという作業。自分で原稿を集めて編集して、ということではなくて文字通り「電子書籍制作」で実態はファイル変換作業。

扱うのは、ほぼほぼ小説なのでデザインやレイアウトはシンプルなものばかり。

(以下はNDAに抵触しない、わたしの作業と使用スクリプトについて)


作業フローとしては

・事前確認

・変換作業

・事後確認

このために作って使ってるスクリプトは、元データ次第なんだけど、

事前確認に5本、変換作業に4本、事後確認に11本

だいたいこんな感じ。


元がひとの入力だし、表記表現の揺れがあったり、タイプミスもあるので、それをスクリプトでひっかけるために、確認用だけで16本のスクリプトが必要となっている。

最終的に目視するにしても、ひとの目視確認は信用できないので、スクリプトで対応できそうなものはスクリプトに任せたい…気がついたら確認用が次々と増えてきた。

もう大丈夫だろうと思っても、ひとのすることは例外処理だらけで、毎回何かある。


1)

原本がPDFの場合、pdf2textを使ってPDFとテキストを比べて確認。

PDFで見た目を調整されてる場合、元データのテキストと違いが出てしまう。違う箇所を引っ張り出して、元データを編集する必要がある。

2)

元データにスタイルが指定されている場合、どんな指定をされているのか確認。

縦中横などの漏れを防ぐためのすべてピックアップして確認をする。

3)

絵文字のチェック。

今どきはutf8なので機種依存についてはあまり気にする必要もないハズだけど、絵文字はさすがにアウト。エッセイなんかだとたまに入ってることがある。レアなケースだから目視で見落とすので、スクリプトにした。

4)

ルビのチェック。

ルビの使い方がわりとフリーダムなこともあって、これをルビにするの?というのを確認しておく。

5)

元データを変換しやすくするために、使わない部分を削除。

必要なのは本文部分で、それ以外が入ってるケースがあるのでスクリプトでカット。


その後、改ページの指定など手作業を入れて事前整形して変換用のテキストデータを作る。

6,7,8,9)

epub3ファイル群に変換する。


10)

半角文字の確認。

縦中横に指定されるべき半角文字列の確認。ついでに、感嘆符や疑問符の後ろに空白がひとつあるかないかの確認。

11)

半角縦中横のタグについての確認。

10で確認した箇所に意図通りのタグが当たってるか、あるいは意図通りタグが当たっていないことの確認。

12)

メタ情報の確認。

epub3に梱包するに当たっては書誌情報ファイルが必要。スクリプトで自動生成させてるので、その確認用

13)

全てのタグの確認。

epub3電子書籍というのはHTMLの集まり。変換スクリプトで正しくタグが当たってるか、どんなタグが当たってるか確認用。

14)

無用な空行、必要な空行の確認。

PDFとの目視確認だと見落としがちなので怪しいところをピックアップ。

15)

目次の確認。

5で改ページ指定などを手作業していて、ここでミスが入り込む可能性がある。ので、epubにした後に原本と目次があってるか確認が必要。

16)

圏点やダーシの確認。

ものによって、原本ままだったり調整が必要だったりするので、確認。

17)

変換後のルビの確認。

4でチェックしたものと差異はないかの確認

18)

変換後の目次の確認。

15とはまた別。こちらは表示用目次の確認。正しく設定されているか。

19)

句読点で終わってないのに改行されている箇所の確認。

見た目の改行とデータ的の改行で違う可能性がある。特にワードなんかが元データの場合。

20)

epubファイルからHTMLタグを削除してただのテキストデータにする。

5で作った変換直前のテキストファイルと差分を確認するため。


列挙してみるとやっぱり確認作業だらけ。確認でなにかひっかかると元データに戻って編集して変換スクリプトで変換してまた確認、というループになる。


スクリプトでやっつけてるので、機械的流れ作業に見えるけど、本(小説やエッセイ、俳句なんか)が好きで読んでなかったら見逃す見落とすケースの確認作業。それらをepub3ファイルにすり合わせるのがキモということになる。紙本と電子書籍、両方のことを知ってないとわからない、というか勘が働かないところだろう。

そこが面白いところだし、わたしが仕事をもらえてるところだと思う(思いたい)。


まだ確認すべきトラップというかご新規さんが出てくるだろうから、確認用スクリプトと目視確認作業は増えるんだろなあ。

ひとの入力は予想がつかないし手強い。


[2024/11/29 10:07:01]追記

スクリプトでもろもろ確認後

kinoppyとkindle previewerでの実際の表示、動作の確認。これが最終形態なので、ここでの目視確認の負担軽減がスクリプト類での確認作業、てことになる。


image

トーハクは庭園もおすすめスポットだった。

ケータイ写真メモスクリプト

2009/11/28 [11:34:11] (土) 天気

ケータイメモが、まだeucのデータだったので、文字コードをutf8に統一。投稿するのはメールだけなので、意外に考えることは少なくて、ガリガリ書いてたら完成した、という感じ。webの表示に今回はPATH_INFOを使ってみたのが自分的ミソ。今さら。

apacheのrewriteを使わなくてもイケるじゃん、と。

大昔から使われている手段らしく、検索すると解説ページも並ぶ。ほとんどがSEOがらみの文脈で、動的ページを静的ページに見せるために、ということだ。今回PATH_INFOを使うことにしたのは、SEOがどーしたとかそんな意図はまるでなく、単なる思いつき。


今さらながら芥川龍之介が面白いんで驚いた。

藪の中

『藪の中』

芥川 龍之介

ただわたしは殺す時に、腰の太刀を使うのですが、あなた方は太刀は使わない、ただ権力で殺す、金で殺す、どうかするとお為ごかしの言葉だけでも殺すでしょう。成程血は流れない、男は立派に生きている、--しかしそれでも殺したのです。罪の深さを考えてみれば、あなた方が悪いか、わたしが悪いか、どちらが悪いかわかりません。


陰惨な話にもかかわらず、どの短編もどこか「可笑しみ」なんだよなあ。なんなんだろう、これ。


[11/28 17:08:06]

で、URLが簡単になったので、twitterに投稿できるようにもしてみた。

Docomoの機種固有番号の取りかたがビミョー。検証できないし、する気もないので良しとしよう。


[11/28 17:43:34]

アクセスログを眺めていたら、IE8がありえないページをリクエストしてきて404エラーを返していた。PATHを途中でぶった切ったような、HTMLの一部をぶら下げたような、妙なURLを要求するのだ。

IEは、HTMLの中のコメントも解釈してレンダリングに影響することがあって唖然としたことがあったけど。なんか今回の妙なURLはそれと似た嫌なハマりしそうな悪寒。

なので、今回のIE8の妙なURLは、現象が特定できないので放置。


もうIEはやめてくれ

風邪ひき

2007/11/28 [09:17:12] (水) 天気

鼻水に寝汗にふしぶしの軋みと緩い腹具合…ひょっとしたらしっかり風邪模様な今日この頃。週末あたりから治らないなあ。

んな状態にもかかわらずページ作成は待ってくれず、だ。

スタイルシートだけでシンプルに決めてやるゼっ、と思ってたんだけど、わたしの知識・スキルでは、どうやってもブラウザ間の妙なギャップが埋められず。しかたなくJavaScriptでブラウザ判定、ちまちま現物合わせっぽく、微妙なところを潰していくことに。…それでも潰せ切れないところはなんとかごまかす方法がないものか、と。あーもう面倒だからページ全部テーブルにしてやる、と何度も吠えてみる。うううむ。htmlとcssってこんなに地味で負荷のかかる力仕事だったのか。ますます髪が抜けていくようだ、ちくそお。


で、ネットショップの方は、去年というか今年同様年末年始は仕事だ。リモートでログインして作業するんだけど、なにかの都合でログインできなかったら事務所まで行かなければならないので、結局帰省とか旅行は無理じゃん。人ひとり貼り付けるほどの商品とはとても思えないんだけど、「おとなのおつきあい」というやつか。このてのは、たとえば日付を仕込んでおいて、システムで面倒をみてほしいよなあ。


で、もう11月も最終週だというのにまだ今月は2冊。すっかり本が読めてない。何歳まで本が読めるんだかわからないけど、たぶんもう折り返してる。ぼーっとしてる暇はないってのに、困ったもんだ。

[更新]2026-02-04 10:01:35

広角嗜好

2005/11/28 [19:20:55] (月) 天気

黙々とかつ淡々とかつガシガシとコーディング作業をしつつ、昼には写るかどうかわからないプラモデルカメラ。昨日、近所の公園で10数枚は撮っていて、今朝も撮りながら出たので、残りわずかだった。いちおうそれなりに選んでぱちぱちしてみたものの、ファインダーで覗くと思ったより狭いなぁ。28mmだからもう少し広く切り取りたいんだけど。

吉野家でかき込んでうろついたら、あっと言う間にフィルムが終了。写ってるかなあ。

多分、景色って動きも視界も含めて頭の中で再構成するから、見えないところまで見えているのだ。いや自分にしか見えないお友達はいませんが。なもんでカメラの画角が狭く感じるんだろう。をっこれって面白いかも、と思ってファインダーを覗くとなんかシラケ気味の構図ってのがけっこうあった。カメラの目線に慣れれば、そのギャップも埋まってくるんだけどね。

競馬場に行ってた頃は望遠(といっても210mmまでのズーム)で、もっと寄れないものかとコンバータが欲しかったのに、今では逆。もっと広角が欲しい。齢とともにこんなところの嗜好も変わるものなのか、と。

今のところ大人の科学の広角がちょうどいい感じ。ピンホールじゃなくて、このぐらいの広さが欲しいかも。と思ってたら、17mmのわいわいワイドというカメラがあった…うううむ、でも使い捨てじゃなぁ。


[更新]2026-02-02 15:23:44

biglobeってnkfが使えたのか!?

2004/11/28 [17:28:34] (日) 天気

昨日はうちで澤乃鶴をちょっと飲みすぎたっぽい。いやこれって、けっこう不味い部類に入る日本酒なんだけど、もらいもので一升瓶であったのでちょっとずつ片付けようと。

おととい、コムスンからテキスト類が届いてたので開けてみてちょっとびっくり。検便をしてその結果を提出しなければならないらしい。実習施設に提出するんだそうだ。うううむ、いったいなにごとが行われるんだろう。12月中に2回、1月に1回レポート提出してその後8日間のスクーリングと4日ほどの実習になるっぽい。

ハローにも通わないといけないし、実質、身にならないことでけっこうバタバタしそうだなぁ。


こないだ作った小ネタ年号変換


image

http://www2s.biglobe.ne.jp/~t2aki/cgi-bin/nengou.cgi


ほんとたかが100行程度のもので、こんなものを見せびらかす意味があるのか、と思い、それならいっそケータイ対応にしてみた。

…って、ケータイからアクセスがあったらSJISにして出力するだけだ。あれ?biglobeってnkfが使えたのか。なんも考えずにbiglobeに流し込んで、今ごろ気づいたぞ。(/usr/local/bin)

リンク時にちょっとつけたすと簡易履歴書を作成するようにしたけど、義務教育以降はひとによって違うだろうから、使い勝手が悪い、んだよねぇ。なので隠しコマンド(というほどのもんじゃないが)


明日は歯医者だったり、家賃・コムスン振込だったり、だなぁ。


介護実習に役立つコミュニケ-ションの良い例・悪い例

『介護実習に役立つコミュニケ-ションの良い例・悪い例』

後藤 真澄

[更新]2026-02-04 13:52:17

<<2026/11>>
       
1234567
891011121314
15161718192021
22232425262728
2930

【最近の10件】

日常読書映画アニメゲーム健康料理グルメカメラ写真ネタ仕事パソコンインターネットperlEPUB3電子書籍ActivityPub
検索: