ひまつぶし雑記帖

doncha.net制作・発行:KindleやiBooks、楽天kobo、BOOK☆WALKERで読む電子書籍

音声付き電子書籍の作り方【6】【制作編】読み上げる文章を抽出する

2015/12/17 [07:28:26] (木) 天気

【制作編】読み上げる文章を抽出する

easy_epubフォルダにあるサンプルファイル「text-file」をエディタで開きます。
(拡張子がなくてうまく開けない場合は、拡張子「.txt」をつけて「text-file.txt」としてください)

同梱されているサンプルのテキストファイルです(text-file)
image
このサンプルファイルの冒頭に
((句読点でspanタグ))
(「カッコカッコ句読点でspanタグカッコカッコ」)
という一行を記入してください。句読点「、。」単位で文章をピックアップできるようにします。

((句点でspanタグ))と指定すると、句点「。」単位になります。
長編などで句読点単位だと音声ファイルが細かくて多くなりすぎたり、HarukaやOtoyaが短かい文章だと読み間違いしてしまうような時に、句点単位の方が良い場合もあります。

また、WINDOWSの場合は、say_easy_epubで音声をつける時にひとつの音声の最後に少しマージンの間が入ってしまうので、句読点単位よりも句点単位で区切った方が聞きやすくなります。

image
一行記入したサンプルファイルを保存したら、easy_epubの以下いずれかの方法で電子書籍ファイルを作ります。

1)EasyEpub.appにtext-fileをドラッグ&ドロップ(Mac)
2)easy_epub.batにtext-fileをドラッグ&ドロップ(WINDOWS)
3)easy_epubフォルダでターミナルやコマンドプロンプトを開いて
「perl easy_epub.pl text-file」
とキーボード入力(Mac WINDOWS)

この後、ターミナル、コマンドプロンプトを使うことになるので3番目の方法がおすすめです。

作成した電子書籍ファイルの中は以下のように、句読点ごとにHTMLのspanタグで区切られています。
image

文章によって句読点と鉤括弧類(「」『』)の規則が違うので不整合を起こす可能性があります。ここで一度epubcheckを使って電子書籍ファイルのエラーをチェックしてください(サンプルファイルではエラーもなく問題はありません)
ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。
perl epub_check.pl 20151213151805.epub
※「20151213151805.epub」は作成した電子書籍ファイル名です。
image
「エラーも警告も検出されませんでした」と表示されたら電子書籍は問題なく作成されています。
(初めてepub_check.plを起動すると、epubcheckの最新版をダウンロードしますので、少し時間がかかります)


次に「say_prepare.pl」を使って、読み上げる文章をピックアップします。
ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。
perl say_prepare.pl
image

SPAN:498:WORD:498 ...count OK
という表示が続いてます。
これは、句読点句切りからピックアップした文の数が合っているかのチェックです。「OK」と表示されていたら問題はありません。
NGと表示されていたら元の文章をご確認ください(だった。」』そして、などと句読点や鉤括弧が複数連続して並ぶとNGになる可能性があります)


say_prepare.plを実行すると、easy_epubフォルダの中に「_voice」というフォルダが作られます。
image
_voiceフォルダの中には以下の3つのファイル、フォルダがあります。
・_span_split_txtというテキストファイル
・multimediaという空のフォルダ
・textという本文テキストの入ったフォルダ

textフォルダに入っている本文は、句読点句切りの電子書籍ファイルに句読点単位でIDをつけています。
image

「_span_split.txt」というテキストファイルが読み上げる文章を記述したファイルです。
image
textフォルダの本文についているIDと、句読点で区切られた文章が一行ずつ並べられています(タブ句切り、文字コードutf8 BOM無)

このファイルを元に音声ファイルを作ります。
say_easy_epubでは、ルビがふってある文字はルビを読みとして_span_split.txtに登録しますが、ルビ以外のところで合成音声の読み間違いなどがあります(「町」「まち」を「ちょう」と読む)
読み間違いや人名、当て字など、この_span_split.txtで平仮名に直したりしながら編集・修正していきます。


音声付き電子書籍の作り方【7】「【制作編】音声ファイルを作る」に続く。 【音声付き電子書籍の作り方】
動画で見る音声付き電子書籍の作り方 (2015/2/22)
音声付き電子書籍の作り方【0】音声付き電子書籍のサンプル動画 (2015/12/11)
音声付き電子書籍の作り方【1】【準備編】Macの合成音声 (2015/12/12)
音声付き電子書籍の作り方【2】【準備編】WINDOWSの合成音声 (2015/12/13)
音声付き電子書籍の作り方【3】【準備編】WINDOWSで音声付き電子書籍を作るために (2015/12/14)
音声付き電子書籍の作り方【4】【準備編】easy_epubとsay_easy_epubの設定 (2015/12/15)
音声付き電子書籍の作り方【5】【番外編】コマンドウインドウやターミナルの使いかた (2015/12/16)
音声付き電子書籍の作り方【6】【制作編】読み上げる文章を抽出する (2015/12/17)
音声付き電子書籍の作り方【7】【制作編】音声ファイルを作る (2015/12/18)
音声付き電子書籍の作り方【8】【制作編】音声付きEPUB3電子書籍の完成 (2015/12/19)
音声付き電子書籍の作り方【9】【番外編】青空文庫に音声をつける (2015/12/20)

»電子書籍制作代行についてはこちら

profile

profile

 
doncha.net
名前:
飯田哲章
mail:
t2aki@mrh.biglobe.ne.jp
twitter:
t2akii

WEBサービス制作/電子書籍制作

検索
<<2017/9>>
     12
3456789
10111213141516
17181920212223
24252627282930

リンク

WINDOWS版サウンドノベル
おかえりください PC WINDOWS版サウンドノベル
『おかえりください』体験版

iPhone電子書籍アプリ
小説同人誌Select iPhone電子書籍アプリ
『小説同人誌Select』