epub3電子書籍制作作業メモ
今やってるepub3電子書籍制作仕事、というか作業に使ってるperlスクリプト類のメモ。
どのクライアントさんも、元データをいただいて、こちらでepub3ファイルに梱包するという作業。自分で原稿を集めて編集して、ということではなくて文字通り「電子書籍制作」で実態はファイル変換作業。
扱うのは、ほぼほぼ小説なのでデザインやレイアウトはシンプルなものばかり。
(以下はNDAに抵触しない、わたしの作業と使用スクリプトについて)
作業フローとしては
・事前確認
・変換作業
・事後確認
このために作って使ってるスクリプトは、元データ次第なんだけど、
事前確認に5本、変換作業に4本、事後確認に11本
だいたいこんな感じ。
元がひとの入力だし、表記表現の揺れがあったり、タイプミスもあるので、それをスクリプトでひっかけるために、確認用だけで16本のスクリプトが必要となっている。
最終的に目視するにしても、ひとの目視確認は信用できないので、スクリプトで対応できそうなものはスクリプトに任せたい…気がついたら確認用が次々と増えてきた。
もう大丈夫だろうと思っても、ひとのすることは例外処理だらけで、毎回何かある。
1)
原本がPDFの場合、pdf2textを使ってPDFとテキストを比べて確認。
PDFで見た目を調整されてる場合、元データのテキストと違いが出てしまう。違う箇所を引っ張り出して、元データを編集する必要がある。
2)
元データにスタイルが指定されている場合、どんな指定をされているのか確認。
縦中横などの漏れを防ぐためのすべてピックアップして確認をする。
3)
絵文字のチェック。
今どきはutf8なので機種依存についてはあまり気にする必要もないハズだけど、絵文字はさすがにアウト。エッセイなんかだとたまに入ってることがある。レアなケースだから目視で見落とすので、スクリプトにした。
4)
ルビのチェック。
ルビの使い方がわりとフリーダムなこともあって、これをルビにするの?というのを確認しておく。
5)
元データを変換しやすくするために、使わない部分を削除。
必要なのは本文部分で、それ以外が入ってるケースがあるのでスクリプトでカット。
その後、改ページの指定など手作業を入れて事前整形して変換用のテキストデータを作る。
6,7,8,9)
epub3ファイル群に変換する。
10)
半角文字の確認。
縦中横に指定されるべき半角文字列の確認。ついでに、感嘆符や疑問符の後ろに空白がひとつあるかないかの確認。
11)
半角縦中横のタグについての確認。
10で確認した箇所に意図通りのタグが当たってるか、あるいは意図通りタグが当たっていないことの確認。
12)
メタ情報の確認。
epub3に梱包するに当たっては書誌情報ファイルが必要。スクリプトで自動生成させてるので、その確認用
13)
全てのタグの確認。
epub3電子書籍というのはHTMLの集まり。変換スクリプトで正しくタグが当たってるか、どんなタグが当たってるか確認用。
14)
無用な空行、必要な空行の確認。
PDFとの目視確認だと見落としがちなので怪しいところをピックアップ。
15)
目次の確認。
5で改ページ指定などを手作業していて、ここでミスが入り込む可能性がある。ので、epubにした後に原本と目次があってるか確認が必要。
16)
圏点やダーシの確認。
ものによって、原本ままだったり調整が必要だったりするので、確認。
17)
変換後のルビの確認。
4でチェックしたものと差異はないかの確認
18)
変換後の目次の確認。
15とはまた別。こちらは表示用目次の確認。正しく設定されているか。
19)
句読点で終わってないのに改行されている箇所の確認。
見た目の改行とデータ的の改行で違う可能性がある。特にワードなんかが元データの場合。
20)
epubファイルからHTMLタグを削除してただのテキストデータにする。
5で作った変換直前のテキストファイルと差分を確認するため。
列挙してみるとやっぱり確認作業だらけ。確認でなにかひっかかると元データに戻って編集して変換スクリプトで変換してまた確認、というループになる。
スクリプトでやっつけてるので、機械的流れ作業に見えるけど、本(小説やエッセイ、俳句なんか)が好きで読んでなかったら見逃す見落とすケースの確認作業。それらをepub3ファイルにすり合わせるのがキモということになる。紙本と電子書籍、両方のことを知ってないとわからない、というか勘が働かないところだろう。
そこが面白いところだし、わたしが仕事をもらえてるところだと思う(思いたい)。
まだ確認すべきトラップというかご新規さんが出てくるだろうから、確認用スクリプトと目視確認作業は増えるんだろなあ。
ひとの入力は予想がつかないし手強い。
[2024/11/29 10:07:01]追記
スクリプトでもろもろ確認後
kinoppyとkindle previewerでの実際の表示、動作の確認。これが最終形態なので、ここでの目視確認の負担軽減がスクリプト類での確認作業、てことになる。
トーハクは庭園もおすすめスポットだった。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
戸籍証明書等の広域交付
年金受給手続きに必要な書類、証明書があるのでメモ
・戸籍謄本
戸籍証明書等の広域交付
https://www.moj.go.jp/MINJI/minji04_00082.html
マイナンバーがあるのになんで謄本が必要なの?と思うんだけど、一応準備をしておいた方がいいみたい。
わたしの場合「なんとなく」本籍地は動かしちゃいけないもの、という意識がどこかにあって、住所が変わってもずっと同じところ。なもんで、戸籍謄本なんかが必要になったら、その都度本籍地の市役所に返信用封筒をつけて、郵送で送ってもらってた。
また面倒くさいなあ、と思って調べてみたら、今年3月から地元の役所で遠方にある本籍の戸籍謄本などを発行(?)してもらえる。らしい。
お役所なので、週末祝日は休み。平日のどこかで聞きに行く。
・被雇用者番号
https://jsite.mhlw.go.jp/tokyo-hellowork/kakushu_jouhou/koyouhoken/koyouhoken/QA/hihokensya_qa.html#11
ハローワークでわかる。
いま契約している会社に連絡してPDFはもらっておいた。ただ、もしかすると「紙」が必要だったら困るな。
で、この被雇用者番号って、一度割り振られた番号をずっと使い続ける。これはもはやマイナンバーと何が違うの?という感じだなあ。
とりあえずこのふたつを用意すれば大丈夫っぽい。
まだまだ余裕があるけど、検索してみると謄本の広域交付はシステムが安定しないみたいで、交付まで10日ぐらいかかるところもあるらしい。その日その場でもらえない。
早めに確認しておくのが吉、っぽいな。
トーハク常設展の遮光土偶
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
特別支給老齢年金のお知らせ
来年で64歳になる。
ということで「特別支給老齢年金」の請求書が郵送されてきた。
いよいよ年金受給者となるんだけど、まあ、年金だけじゃ食っていけない。学生のアルバイトにも届かない金額。
その程度とはいえ、一定の金額が安定的に入ってくる状態、というのはありがたいのも確か。
年金プラスなにかアルバイトなどの別収入を、と考えられるので少し気楽、かな。
還暦過ぎて働かなきゃ食っていけないのはなかなか鬱陶しい話で。
以前は、ライスワークとして割り切って、とか思ってたけど、歳を食うにしたがって当然ながら残り時間が少なくなってくる。
残り時間が少ないとなると、興味もないくだらないライスワークに貴重な時間を使いたくない。
現状2本立てでやってる。
現場に行って時間で身柄拘束される仕事と在宅で成果物を制作納品する仕事。
在宅の制作仕事は電子書籍の制作。
これはライフワーク。本が好きで新卒で底辺エロ出版社に入社して退社後もずっと本、出版にこだわってきた。電子書籍の制作はやっていて楽しい。
身柄拘束仕事が、本当にライスワーク。
会社ごっこにはストレスしかないけど、ライスワークとして割り切ってきた。
収入、ギャラでいうと、時給換算すると10倍ほど違う(改めて自分でも吃驚)
もちろん制作仕事の方が桁違いに高い。ただ、安定しない。多い時と少ない時の差が大きくて、これだけだと不安っちゃ不安。
しかたなくライスワークで老人の貴重な時間を切り売りするしかなかった。
このライスワーク部分。年金で補填、なんてのはさすがに無理だけど、年金と制作仕事で食っていけないこともない。
安定収入ってありがたいよなあ(今さら)
これでやっとライスワークに時間を使う必要がなくなった。
特別支給老齢年金というのは。
昭和60年(1985年)の法改正により、「老齢厚生年金」の受給開始年齢が60歳から65歳に段階的に引き上げられることになりました。このとき、現役世代への影響を軽減するため、引き上げ完了までの「つなぎ」として新設されたのが「特別支給の老齢厚生年金」です。
ということで昭和36年4月1日以前に生まれた人間が対象。
そう、ぎりぎり滑り込みセーフだ。
東京国立博物館は各館の常設展も充実してる。
特別展だけでお腹いっぱいで帰ってきてたんだけど、先日は昼食休憩を挟んでいろいろ観てきた。ほんと飽きない。マジおすすめ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」