InDesignが書き出すEPUBのモノルビの後始末

InDesignが吐き出したEPUBファイルを電書協準拠のEPUBファイルにしてね、という話。
電書協準拠というのは、フォルダ構成やファイル命名規則、スタイルシート群のことで、雛形に流しこめばほぼOK。
ただ、小見出しや圏点、縦中横などはInDesignで作成時にあてられたスタイルを確認してコンバートする必要があったり手作業がそれなりに積み上がる。
中でもルビがやっかいだった。
「No.36【CS5.5】EPUB関連 EPUB3.0対応」InDesignの勉強部屋
http://study-room.info/id/studyroom/cs5/study36.html
↑こちらに詳しい。
グループルビはそのまんま。
一文字ずつモノルビをあてた場合もそのまんま。
問題なのが、モノルビを二文字など複数文字にあてた場合だ…ていうか「モノルビ」っていうぐらいなんだから複数の文字に使うのがどうかしてるだろ。
「準拠」にモノルビ(じゆんきよ)の場合、EPUBに書き出すと
グループルビの中、ルビが「じゆん」「全角空白」「きよ」となってしまう。
(EPUBはモノルビの rbタグは使えないので、グループルビの rtタグになる)
ルビに意味不明な空白などありえない。きちんとひと文字ずつのルビにしてやる必要がある。
学術書系や小説なら時代ものなどはこのルビ修正だけで生き地獄。しくしく。
てことで、InDesignの吐き出すEPUBの変なモノルビを、ひと文字ずつの正しいグループルビに変換するサブルーチンを書いた。
ソフトが書き出すものだからツールで変換するのが確実。ひとの手でひとつずつ修正してたら、まず間違いなくどこかでミス・タイポが入りこむ。
ほんとperlがなかったらと思うとぞっとする。
この手の細かいスクリプトがあちこちのフォルダに散らばってる。
そのうち整理してまとめなきゃと思いつつ、汎用、使いまわしを考えすぎると、結局使う時に面倒が増えたりして使い勝手の悪いものになるからなあ。悩みどころ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
固定レイアウト型EPUBで消耗してるヒマがあったらPDFだろ

ほんとたまたま重なっただけなんだろうけど。先月末ぐらいから今月に入って「固定レイアウトのEPUB3について」という話が飛んでる。
EPUBにパッケージすることで電子書籍市場が広がるので、売ることを考えるならガタガタ言わずにEUPBにするべき。でも、企業のパンフレットやカタログなんかは売る必要もない。ただし、品質的に、レイアウト・デザインは絶対に譲れない。リフローで見た目が違ってくるなんて論外である、という類のものだ。
イラストレーターやインデザインで組まれてPDFに書き出されて印刷されたもの。それを、そのまんま電子書籍で再現してくれ、ということになる。
それって、そもそもEPUBの電子書籍にする必要はあるんだろか。
オーサリングとしてめちゃくちゃ頑張ってテキスト込みで組んだ固定レイアウトのEPUB3ファイルにするにしろ、PDFを画像にして安直な固定レイアウトのEPUB3ファイルにするにしろ、固定レイアウトのEPUB3のメリットが見えないんだよなあ。
印刷に使ったPDFがあるんならそのままWEBに上げてPDFリーダーで読んでもらえば、印刷物そのまんまだし、検索もできるし、それこそ「ふりだしに戻る」だけどプリントアウトもできる。
WEBでPDFを開くのは「PDF注意」などと書かれてるところがあるように、面倒くさいのは確かだ。でも、WEBで固定レイアウトのEPUBを開いて読むのは、おそらくリフローなどとはケタ違いのサイズのファイルを開くことになるだろうから、やっぱり重苦しい。
コーポレートサイトにアクセスしてパンフなんか、その場で見るならともかく、ダウンロードして電子書籍端末やアプリで読むというのも考えにくいだろう。
てことで、固定レイアウト型EPUBファイルのPDFに対する優位性がまるで見えてこない。というかそれ以前に固定レイアウト型EPUBファイルの存在意義すら疑問に思えてきた今日この頃だ。
生徒全員にipad支給というところもあって、教育の現場でibooks、電子書籍に注目が集ってきてるだろうし、実際、教育現場へのICT導入を推進する超党派の議連もあって金が流れ込みそうでもある。教科書なんかは固定レイアウトEPUBの出番なんだけど、無理矢理の電子書籍じゃないかなあ。PDFで何がいけないのかがわからない。
ひとつ利点があるとすると、電子書籍にすれば音声を付けられる。視覚に障害のある子やディスクレイシアの子にとって有用…でも、スクリーンリーダーもあって、そこに読み上げ部分をハイライトさせる機能をつけるのと、音声つき電子書籍の普及とどっちがどっちなんだろか。技術的なことはわたしは素人なのでわからない。
文字を、テキストを読むパッケージとしてリフロー型EPUB電子書籍はこれからの読書環境だと思うし、そうなるだろう。
でもなあ、固定レイアウト型EPUB電子書籍はどうなんだろう、これから頑張れるんだろうか。もっとも、PDFにはもう伸び代もなさそうだし、どっちもどっちなんかなあ。
ちなみに、最近ついったで流れたきた固定レイアウトのネタ
5/13
インデザの固定レイアウトEPUBはそもそもiBooksでの販売しか保障してません
5/17
でんでんコンバーターから固定レイアウトをつくってみた
5/18
5社全部に配信できる単一の固定型EPUBは作れない
いやもう固定レイアウト型EPUBファイル制作は「茨の道」である。
(とはいえ、macport経由でImagemagickも無事macにインストールしたので、画像書き出しでOKなら、PDFからの固定レイアウトもどんとこいですよっ/セールストーク)
ちなみに、神保町というか白山通り脇の天ぷら「いもや」だけは間違いがないなあ、と数年ぶりに食って実感。ここの春菊の天ぷらとしじみの味噌汁は鉄板だ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
なろうをタテにしてEPUB3電子書籍でヨム

カクヨムをEPUB3の電子書籍に変換してダウンロードするスクリプトを書いたんだけど、カクヨムはR18禁止なのでR18がOKのなろうに退避するケースもあるとかないとか。
カドカワもTL(ティーンズラブ)小説があったような気がするけど、エロではない、ということかな。
てことで、なろうに上がっている小説をEPUB3に変換してダウンロードするスクリプトをでっち上げた。
ttp://ncode.syosetu.com/XXXXXXX
↑小説トップページ(?)目次ページのURLを入力すると電子書籍としてダウンロードできます。
とはいえ、なんだかなろうは商標についてのページや利用規約やガイドラインなんかを見るとどうもややこしいところのようなので(印象)、ダメっぽかったら取り下げます。悪しからずご了承くださいませ。
https://t2aki.doncha.net/tmp/narou2epub.pl
↑例によって直リンクできないフォルダなのでこちらのリンクからどうぞ。
ちなみに。
なろうを電子書籍化するサービスやアプリはすでにあるので、ニーズにあったものを探して利用してみましょう。ウチのより高機能。
「なろうを電子書籍化」WEBサービス
http://narou.nyanpass.jp/
「Narou.rb」rubyアプリ
https://github.com/whiteleaf7/narou/wiki
「AozoraEpub3」javaアプリ
http://www18.atwiki.jp/hmdev/pages/21.html
カクヨムを電子書籍に変換してダウンロードするページはこちら
https://t2aki.doncha.net/?id=1457873699
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
カクヨムをタテにしてEPUB3電子書籍でヨム

時事ネタ。
カクヨムの作品URLを入力したらEPUB3の電子書籍としてダウンロードできるようにしてみた。
カクヨムに上がっているWEB小説をEPUB3ファイルにすることで、KindleやiBooks、Kobo、Knoppy(紀伊国屋)、hontoなどの電子書籍リーダーやアプリで読むことができる。
サイトをクロールしてEPUB3にパッケージするスクリプト程度なら手元の部品の継ぎ接ぎでそれっぽいのができるので作った。
(カクヨムのHTMLの構造が変わったらそれまでだし、たぶんカドカワのことなのでそのうちEPUB3変換のクチも別メニューで出てきそうで、メンテするのも不毛なのでこれっきりの一発ネタだろう)
https://t2aki.doncha.net/tmp/kakuyomu2epub.pl
↑カクヨムを電子書籍にしてダウンロード
※直リンクできないフォルダなので、ご利用の場合はこのリンクからよろしく。
※権利侵害にあたるような利用は厳禁です。
※検索などでこのページにたどり着いたらURLが「https」で始まっているか確認ください。「http」だとたぶんいろいろ表示できていません。
アンドロイドのスマホでダウンロードできないことがあるけど、アンドロイドアプリのFirefox(https://play.google.com/store/apps/details?id=org.mozilla.firefox&hl=ja)ならダウンロードできます。それ以外、PCやMac、iphoneなどは問題なくダウンロードできます。
[2020/01/27 22:11:50]
カクヨムのページを見ると書籍化作品が着々と増えていた。WEB掲載が商業デビューのパスとして確立してきてるんだな
カクヨムは横書きのサイトなので半角の英数字などは縦書きにしても寝転がったまま…うーん、こりゃしょうがあるまい。
(かなりテキトーなでっちあげ)
[2016/03/15 16:15:01] 追記。
連続する半角数字以外に、半角の「!?」「?!」「!!」に縦中横のスタイルを当てるようにした。
[2016/03/19 10:59:01] 追記。
それっぽい奥付生成。
完結したストーリーの本文を取りこぼすバグ修正。
[2018/05/22 21:44:12]
カクヨムのHTMLが変わっていて目次を取得できなくなっていたのを修正。
また、一部の文字(実体参照)は面倒なんで削除することにした。
なろうを電子書籍に変換してダウンロードするページはこちら
https://t2aki.doncha.net/?id=1460978141
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
紙印刷本から電子書籍から紙印刷本というエコシステム

InDesignからSigil経由のEPUBファイルをInDesignへ。
何を言ってるかわからないと思う。わたしも最初聞いた時は驚いた。
紙で出版されたものが電子書籍として配信されて、今度はその配信されたものを組み直して再び紙印刷本へというお話。
売れっ子グラビアアイドルが、AVに出演した後、温泉街のストリップに流れる、みたいな変遷。逞しい話で、名作(テキスト)は姿形を変えてもしっかり生き残るという良い例だろう(ほんまか)
おそらく元になってるInDesignデータは出せなくて(権利的な話じゃなく、たぶん探すのが面倒、もしくはもうなくなっているので)電子書籍のEPUB3ファイルを元にするしかない。
ということで、そのEPUB3ファイルをバラしてInDesignに流し込みという雇用創出となった。
まだEUPBファイル制作のソフトが出揃ってなかったんだと思う。
ファイルは、一時使われていた縦書きにもできる改造版Sigilで作られているっぽい(EPUBファイルのフォルダ構成やファイルの命名規則がどっかで見たことあるなあと)
でもまあ、青空記法に独自規則のアレンジとかdotBookからのHTMLっぽいデータよりはEPUBファイルの方が扱いやすい。
・組み直しになるので、元のレイアウトにこだわる必要ない。
・小説なので、EPUBファイルから拾い上げるのはルビと圏点、外字程度。
ルビはグループルビのタグがついているし、圏点はsesame(ゴマ)というクラスが指定されている。外字は画像になってるのでそこは「〓」にしておいて校正で対応。
↓InDesignにはタグ付きテキストというのがあって
http://help.adobe.com/ja_JP/indesign/cs/taggedtext/indesign_cs5_taggedtext.pdf
テキストデータにルビや圏点のタグを付けてInDesignに「配置」すればそのままルビも圏点も生かしてくれる。
以下のスクリプトでEPUB3のルビと圏点のタグをInDesignのタグに変換してやれば大丈夫だった。
文字コードでちょっとハマった。
InDesignで「配置」する時、文字コードはShift_JISかUTF16じゃないと文字化けしてしまう。
元にするEPUB3ファイルの文字コードはutf8(BOM無し)。
EPUB3のUTF8をShift_JISにすると文字化けを起こす可能性があるような気がするので、とりあえずutf8のまま上記スクリプトでタグ変換して、エディタで開いて文字コードをUTF16に変換した後、配置した。
Adobeのタグ付きテキストのPDFを見ると、かなり細かく制御できるので、ちゃんと探せばこの手のコンバート系でいろんな強力なツールが出てるはず。
でも、たぶん、そんな継続する案件でもなさそうなので、テキトーな使い捨てスクリプトでやっつけ仕事。
しかし、ほんとニッチな需要もあったもんだ。
ガッテンしていただけたでしょうか。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
音声付き電子書籍の作り方【9】【番外編】青空文庫に音声をつける

【番外編】青空文庫(http://www.aozora.gr.jp/)に音声をつける。
音声付き電子書籍の作り方がわかっても、肝心の中身、小説などの本文をどうするの?
オリジナルの小説、テキストデータなんてそんなにないよ!
ということで、青空文庫の膨大な名作の蓄積を利用させていただくことにします。
青空文庫をEPUB3電子書籍にするツールとしては「AozoraEpub3 - 青空文庫ePub3変換」http://www18.atwiki.jp/hmdev/pages/21.html が有名で定評もあります。
(青空文庫形式で書かれた小説などが、このAozoraEpub3で電子書籍化されて、kindle KDPの販売にも使われています)
また東芝が提供するDAISY図書制作サービスでは青空文庫形式のルビを生かすこともできます。
青空文庫が広く普及していることで、青空文庫の組版規則(http://kumihan.aozora.gr.jp/)はいろんなツールやサービスで使われているようです。
残念ながらeasy_epubは青空文庫の記述方法が使えません。
以下のスクリプトで、青空文庫のテキストをeasy_epubで読みこめるテキストデータに変換します。
http://t2aki.doncha.net/release/strip-aozora.zip
底本を忠実に再現するという青空文庫のポリシー(?)に反することになりますが「ルビ・傍点・太字」の3種類をHTMLのタグに変換したテキストデータを作ります(それ以外、たとえば「字下げ」は反映していません)
青空文庫の『銀河鉄道の夜』を変換してみます。
コマンドプロンプト(WINDOWS)、ターミナル.app(Mac)で以下のコマンドを入力します。
コマンド:
perl strip-aozora.pl gingatetsudono_yoru.txt
※補完機能を使うと「perl」「半角空白(Space)」「str」「Tabキー」「半角空白(Space)」「gin」「Tabキー」だけです。いちいち「gingatetsudono_yoru.txt」などと全部キーボード入力する必要はありません。
同じフォルダに「aozora-」がついた「aozora-gingatetsudono_yoru.txt」が作られます。
青空文庫形式からHTMLタグに変換したテキストデータに変換されています。
ここにタイトルや著者名を入れてeasy_epubでEPUB3電子書籍にすることができます。
MacやWINDOWSのシステム音声を使った音声付き電子書籍は。
・無料で作ることができる。
・朗読よりも早く手軽に作ることができる。
・フリーの合成音声より聞きとりやすい。
といったメリットがあります。
システム音声の使用許諾で個人での利用に限定されますが、いろんな理由から「読書困難」な方が「読める・聞ける」本として音声付きEPUB3電子書籍は有用です。
ここに記載した手順通り、それほど難しいものではないので、ぜひ一度作ってみてください。
また、他にも音声付き電子書籍を作る方法があって、おのおのクオリティや手順も違うので、やりやすい方法を試してみてはいかがでしょう。
【参考URL】
・音声付きEPUB3電子書籍制作
「easy_epub」
http://t2aki.doncha.net/release/easy_epub.zip
「say_easy_epub」
http://t2aki.doncha.net/release/say_easy_epub.zip
・合成音声
「AITalk」
http://www.ai-j.jp/
「VOICETEXT」
http://voicetext.jp/
「ボイスソムリエネオ」
http://www.hitachi-solutions-business.co.jp/products/package/sound/voice/
「音訳エディタDaisyRings」
https://www.toshiba.co.jp/cl/pro/recaius/lineup/daisyrings.html
・WINDOWSのシステム合成音声
「Microsoft Speech Platform 簡単インストーラー Ver.2.2」
http://mahoro-ba.net/e1542.html
「もぎゃろぐ「Windows7で音声合成(Text to speech)」
http://blog.mogya.com/2012/01/windows7text-to-speech.html
「どんぶらこDESIGN「Windows7で日本語読み上げ機能を使う」
http://donboolacoo.blog92.fc2.com/blog-entry-1623.html
・スクリプト言語、エディタ、ツール
「Active Perl」
http://www.activestate.com/activeperl/downloads
ffmpeg「お気に入りの動画を携帯で見よう」
http://blog.k-tai-douga.com/
エディタ「CotEditor」(Mac)
https://itunes.apple.com/jp/app/coteditor/id1024640650?mt=12
エディタ「mi」(Mac)
http://www.mimikaki.net/
エディタ「サクラエディタ」(WINDOWS)
http://sakura-editor.sourceforge.net/index.html.ja
エディタ「EmEditor」(WINDOWS)
https://jp.emeditor.com/
・青空文庫
「青空文庫」
http://www.aozora.gr.jp/
「青空文庫組版案内」
http://kumihan.aozora.gr.jp/
「AozoraEpub3 - 青空文庫ePub3変換」
http://www18.atwiki.jp/hmdev/pages/21.html
「青空文庫をeasy_epubで使えるテキストデータに変換」
http://t2aki.doncha.net/release/strip-aozora.zip
ここでは紹介しませんでしたが、以下のURLも参考になりました。
・電子書籍制作
「でんでんコンバーター」(「文を句点ごとにspanで囲む」)
http://conv.denshochan.com/
・合成音声
「SofTalk」
http://www35.atwiki.jp/softalk/pages/1.html
「棒読みちゃん」
http://chi.usamimi.info/Program/Application/BouyomiChan/
「株式会社アクエスト - AquesTalk」
http://www.a-quest.com/
「Aquestの音声記号列仕様書」
http://www.a-quest.com/download/manual/siyo_onseikigou.pdf (※PDF)
・オーサリングツール
「Tobi」
http://www.daisy.org/project/tobi
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」