動画で見る音声付き電子書籍の作り方

ここんとこマイブームとなっている音声付き電子書籍。
ウチのeasy_epubを使うこととmacを前提として、音声をつけるためのスクリプトを3本書いてみたので、音声付き電子書籍の作りかたを晒します。
[2015/12/17 08:09:33]
音声付きEPUB3電子書籍の準備から制作まで詳細は
「音声付き電子書籍の作り方【0】」https://t2aki.doncha.net/?id=1449791838
↑こちらからどうぞ。
・必要なもの
mac
読み上げ音声のために
「システム環境設定」→「音声入力と読み上げ」→「テキスト読み上げ」→「システムの声」
KyokoさんかOtoyaさんをインストール
(※Windowsはこちら→https://t2aki.doncha.net/?id=1424757485)
perl
MP4の情報取得のために
MP4::InfoをCPANからインストール
https://search.cpan.org/~jhar/MP4-Info-1.13/
EPUB3ファイル作成のために
かんたんEPUB3作成easy_epub
https://t2aki.doncha.net/easy_epub
作成手順を動画にしてみました
以下はすべて easy_epub/ フォルダの下で作業。
・下準備その0
perl easy_epub.pl テキストファイル
読み込ませるテキストファイルに「((句読点でspanタグ))」と一行追加してepub3ファイルを作成。
・下準備
perl say_prepare.pl
その0でspanタグを挿入されたところにさらにidを記入。
spanタグでくくられた文章を抽出
ルビがあったらルビを展開して、ルビを読むようにしている。
(この時、SPANと抽出した文章が違ったりするとNGと出るので対応必須)
_voice/ というフォルダ以下に、電子書籍に音声を付けるためのファイルを生成。
_voice/_span_split.txt 句読点でバラされた文章が一行ずつ書かれている
_voice/text/ 以下にidをふられた本文ファイル(.xhtml)
・音声ファイルの作成
perl say_mac_m4a.pl
下準備で抽出した文章をmacのsayコマンドで音声ファイルに書き出す。
(※ WindowsでもSoftalkを使えば同じことができる。ただし、音声ファイルは.wavファイルとなるのでコンバートが必要)
読み間違いがあったら _span_split.txt の文章を「平仮名」にして対応する。
・音声同期ファイルとEPUB3パッケージファイルの編集
perl say_setting.pl
読み上げ音声が読んでいる箇所を同期させるための . smil ファイルを生成。
epub3のパッケージファイル(content.opf)の追加&編集。
・EPUB3電子書籍ファイルに上記で作成した音声をつけるためのファイルを入れる
_voice/content.opf を OEBPS/content.opf に上書き。
_voice/text/ にある .xhtml ファイルを OEBPS/text/ にある .xhtml に上書き。
_voice/multimedia を OEBPS/ にコピー。
epub3ファイルにzipで固める。
zip -r 「EPUB-FILE 」OEBPS/*
https://t2aki.doncha.net/release/say_easy_epub.zip
↑スクリプト3本セット。
例によってコードが汚いのは素人芸なので勘弁してください。
この作りかただと、棒読みだし、音声ファイル数がこの掌編でも約600個にもなってRSにファイル数上限なんかがあったらアウト。手間ヒマかけずに「とりあえず音声を付けたい」というだけのシロモノです。
↓ SofTalkで音声を用意して、Windowsで音声付き電子書籍を作成する方法
『Windowsで縦書き総ルビの般若心経を読み上げ』
↓音声のアクセントや区切りを調整して自然な読み上げに
『電子書籍につける音声の調教』
たぶん。
今後はVoiceOverやTalkbackといったアクセシビリティ=ユーザー補助での読み上げが技術的に進化・深化して、誰にとっても、より聞きやすく使いやすいものになる。
とはいえ、現状は
・読みの校正・編集ができない
・読み上げ部分のハイライト表示ができない
ということで電子書籍に関してはmedia overlaysを使ったEPUB3の出番だろう。
人工の音声合成にしても会員制のものや50万円クラスのソフトだとかなり自然に聞こえる。これらが限定解除されたり気軽に手の出せる値段になってくれば一気に普及しそうな予感。
本の権利処理がネックになりそうだけど。
著作権切れの青空文庫を片っ端から音声を付けた電子書籍にして図書館のパソコンで読めるようにすると面白そう。
近畿視情協主催「どうなる! 電子書籍のアクセシビリティ ~ だれにも使える「本」の実現をめざして」#近畿視情協201519
https://togetter.com/li/785303
というまとめを読むと図書館では、電子書籍は否定的らしいんだけど(高齢者は紙の本を読みたい/そもそも図書館・職員自体デジタルに疎い)ウチの地元の図書館はIT情報コーナーとかあってパソコンも複数台用意されてるしなあ。
実際に作った音声付き電子書籍一覧
『「眼聴耳視」音声付き電子書籍公開リスト』
図書館の日常業務でお忙しいとは思いますが、音声付き電子書籍のお試しにいかがでしょう。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
楽天koboでも無料販売開始しました

『酒を片手に庭に出る〜日野裕太郎短編集』
「酒を片手に庭に出る」[ホラー掌編:約7ページ(39字x18行)]
「衝撃はショウを動かす」[幼児ハードボイルド:約5ページ(39字x18行)]
「トト」[現代ドラマ:約16ページ(39字x18行)]
iBookstore、google playで単話ごと無料頒布している作品3編をまとめて収録した短編集。
【楽天kobo】【無料頒布】こちらからどうぞ → 『酒を片手に庭に出る〜日野裕太郎短編集〜』
昨日の 雑記にも書いたようにkoboの管理ページ はとてもわかりやすくてあっけないほど簡単。昨日の夜に登録して、朝起きたら販売されていた、というスピードも吃驚(24時間〜72時間と書かれてたけど)
本文のEPUB3とカバーアートをアップロードする・書誌情報を入力する、だけ。
(KDPだと入力通り・意図通りにならないことが多いジャンル・カテゴリもkoboだと入力した通りになっている)
EPUB3データはいつものように 「かんたんEPUB3作成easy_epub」 で作ったものをそのまま登録に使った。koboは特にクセもないようでエラーのないEPUB3データであればOK。
eISBNなど「Optional」の部分は入力する必要はない。販売地域を選ぶところは日本だけにしておいた(海外のkoboに並べてもなあ…)。
値段をゼロ円にすると無料販売となる。
今日時点の利用規約で確認できた支払い関係。
・299円以上だとロイヤリティは70%。それ以下だと45%
・支払いは。100ドルを超えていたら毎月。100ドルに満たない場合は6ヶ月後。
koboは楽天傘下になったけど、確かカナダの会社。アメリカの会社Amazonで必要だったW8BENなどは不要なのかなあ。今のところ、そのあたりが不明のまま。昨日も書いたようにkoboというより楽天koboがWriting Lifeのサービスを開始するのを待ってからの方がいいかも知れない。
管理ページはセンスもいいし、直感的にわかりやすいUI。
また、楽天koboは専用端末に、PC、Macのデスクトップアプリ、iPad、iPhoneなどiOSアプリ、タブレットなどのAndroidアプリと、マルチプラットフォーム対応という点ではkindleより広くカバーしているので期待したいところ。
(プラットフォームをお借りしている店子の身で言うのもどうかと思うが、楽天の詳細ページはチラシがひどいよなあ)
[02/23 11:02:44]
ユーザーガイドに「TAXES」と税金の項目はある。
これを見ると、どうやら源泉徴収はなさそうな…(貧弱な英語力だ)
5ユーロで販売したものが、VAT(Value Added Tax 消費税。EUは20%)分差し引かれて、70%のロイヤリティ2.8ユーロが手元に入る計算。
ガイドによると、各々販売するテリトリ(国)の消費税を乗せて販売価格をつけてね、と。
てことは、KDPですったもんだやきもきしたEINの取得やW8BENでの減免申請は不要ってことかな。
楽天と直接やってる版元の場合は〆日なんか違うので、日本で楽天でwriting lifeを開始して欲しい。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
ルビのため perl unicode正規表現

EPUB3::かんたん電子書籍作成 https://books.doncha.net/epub/ では、テキストデータにルビや縦中横のHTMLタグを自動で振るためのオプションを用意してある(※ ページ中ほどにある [スクリーンショット、ルビや縦中横タグを挿入するにはこちら] のリンク)
そのための perl の正規表現メモ。
縦中横。
半角の、「!?」「!!」「?!」と、連続するアルファベット、連続する数字に span タグで縦中横のクラス tcy をつける。
ルビ。
「漢字(るび) 」と漢字に続いて半角のカッコに囲まれたひらがな・カタカナをルビとして ruby rt タグをつける。
※ WORDのルビつき文書をテキストで出力すると半角カッコの中にルビが入る
縦中横のタグはけっこうよく使う正規表現なのですんなり。でもルビのための漢字判定がちょっとわからずグーグル様。perlは5.8以降、ユニコードによる正規表現が使えるようになって、文字クラスを下記のように指定することができる。
ルビもこれを使って正規表現。でも、スクリプトでは、どこからルビなのか判断できない。東京都千代田区(ちよだく)と書いてあったら、「千代田区」ではなく「東京都千代田区」に「ちよだく」のルビがつく。「千代田区」にルビですよということで「東京都[#ルビ]千代田区(千代田区)」などとテキストにマークアップする必要がある。
「EPUB3::かんたん電子書籍作成」 のコンセプトは
「何も考えずにテキストを放り込んだら、それっぽい電子書籍ができる」
面倒っぽく感じる・小難しそうなことは極力排除したいので、Wikiやはてなで使われるような独自記法・方言マークアップは却下とした。
レイアウトデザインを作り込みたいということであれば(字下げや文字方向一部変更など)EPUB3ファイルを解凍して直接xhtmlに対してタグをつけて、CSSを作れば可能。「かんたん電子書籍作成」で作るHTMLとCSSは、こんなでいいのかというぐらい手抜きレベルに単純なHTMLなので、編集加工がしやすい元素材でもある。
HTMLタグのついたテキストデータで小説原稿などを保存管理するのは面倒なので、元原稿はプレーンな状態にしておきたい。間違えて元データを消してしまって、HTMLタグのついたデータしか残ってない!という場合に。
テキストデータからHTMLタグを除去する正規表現
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
何もしない一日

目が覚めたら11時過ぎていた、という惚けな一日の始まり。ヨメは頭痛で、わたしも口が渇いてカスカスする。体調がよろしくないっぽいんで、ネコ缶ネコ砂の買い出しと写真の引き取り、クリーニングの引き取り、でチャリ出動しただけ。あとは引きこもる。 COSINA CT1 SUPER Phenix50mm
昨日の上野公園。寒桜に群がるひとたち、妙にサイキックだった花園神社。公園についていきなりこの桜、目を疑う。
公園の中はやたら人懐こくてデブなネコがあちこちそこここ。誰かご飯をあげてるとしか思えない。 COSINA CT1 SUPER Phenix50mm
例によって、ほか写真は
ttp://www.holeinthewall.jp/~butch/zakki/camera.pl?id=61
ttp://www.holeinthewall.jp/~butch/zakki/camera.pl?id=62
に。
Phenix50mmってけっこうしっかり写るなあ。お買い得だったかも。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
またもや風邪っぽく

サーバーのログに、ad0でWRITE_DMA retryうんぬん、てのが残っていていやぁな悪寒。検索してみると案の定、HDDが壊れる予兆、らしい。ハードウエアのことはまったく無知。バックアップするにしてもセカンダリに別のHDDをつけてそこにdump&restore…なんだけど、セカンダリってナニそれ、だし、からまってる幅広のリボンみたいなケーブルのどこにつけるのか、なんてわたしにとっては、ジャガーノートの赤を切るか青を切るかと同じだ。今のサーバーにした時のように、もう一台パソコンを買ってインストールし直し=リプレースする方が早い。現状、一台で転がしてるからこういうときに困るんだよなあ。この際だから、もう一台、予備機を調達するか。メモリ2G積んでも、セレロンなら4万円台で買えるし(今、メモリが安い)
…うーん。ハードウエアのスキルがないのは、いやーん、だ。
いっそ。ハードウエアのスキルを身につけるために、自作に走る、というのもありかも知れん(ほんまか)
ついでに。なんかまたもや風邪っぽく、頭痛に襲われていやーん、だ。下まぶたもチック状態。
あしたは、朝っぱらから歯医者で水道橋、夕方は同窓会のようなものでおっさんの集まりがあって池袋。こんな体調で大丈夫か、おれ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
風邪くさいなぁ。

気温湿度が妙にほわほわしていて、体調がおかしくなってる、ような気がする。まあ、しっかりおっさんだし、髪・歯はすでにがたがた。
vi を使ってHTML、PHPの書き換え。て、リンクぐらい書き直しておけよ、と。地方のレベル、といってしまっていいんだろうか。てのは、ともかく、/usr/local/直下でroot権限の時ってふにゃふにゃなんでもできてしまうemacsより、コマンドモードと入力モードのわかれてるviの方が安心できるんだよなぁ。使いこなすスキルもないし、せいぜい置換に使うぐらい。
↓ページ全部の置換
:g/文字列1/s//文字列2/g
ちまちまスクリプト書きの続きも。蔵書管理部分の、修正とか削除はつけた。検索・表示にひと工夫が欲しいところだし、まだ入力のところで考えないと、だなぁ。50音順表示するにはフリガナを入力する必要がある。メンドーなことは極力したくない。データものの最大のネックはデータ入力なのだ。ン1000万件のデータも軽々扱えます…それって誰が入力するねん、ということ。
ちょっとでも入力で面倒だと思ったらそれだけで続かないのは、われとわが身で検証済みだぞ。
ISBN入力だけでOKにしたので少しはラク。だけど、
本読み連中の連載「大人買い」にどうするか、だよなぁ。アマゾンはISBN検索はかなり早いんだけど、キーワード検索かけるとけっこう重いので、これに使うには現実的じゃない。「とりあえずおいとく」場所も作ってみるか。
てことをやってると、SNSもどきの日記だとか掲示板だとか、友達だとかの機能までやってるといつ出来上がることやら。先がいっきに遠ざかってしまったような…。気力が持つかねぇ。本棚の晒しあいだけにしておくかしらん。
なんか身体もだるいし風邪ひいたかなぁ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」