音声付き電子書籍の作り方【6】【制作編】読み上げる文章を抽出する

2015/12/17 [07:28:26] (木) 天気

【制作編】読み上げる文章を抽出する


easy_epubフォルダにあるサンプルファイル「text-file」をエディタで開きます。

(拡張子がなくてうまく開けない場合は、拡張子「.txt」をつけて「text-file.txt」としてください)


同梱されているサンプルのテキストファイルです(text-file)

image

このサンプルファイルの冒頭に

((句読点でspanタグ))

(「カッコカッコ句読点でspanタグカッコカッコ」)

という一行を記入してください。句読点「、。」単位で文章をピックアップできるようにします。


((句点でspanタグ))と指定すると、句点「。」単位になります。

長編などで句読点単位だと音声ファイルが細かくて多くなりすぎたり、HarukaやOtoyaが短かい文章だと読み間違いしてしまうような時に、句点単位の方が良い場合もあります。


また、WINDOWSの場合は、say_easy_epubで音声をつける時にひとつの音声の最後に少しマージンの間が入ってしまうので、句読点単位よりも句点単位で区切った方が聞きやすくなります。


image

一行記入したサンプルファイルを保存したら、easy_epubの以下いずれかの方法で電子書籍ファイルを作ります。


1)EasyEpub.appにtext-fileをドラッグ&ドロップ(Mac)

2)easy_epub.batにtext-fileをドラッグ&ドロップ(WINDOWS)

3)easy_epubフォルダでターミナルやコマンドプロンプトを開いて

「perl easy_epub.pl text-file」

とキーボード入力(Mac WINDOWS)


この後、ターミナル、コマンドプロンプトを使うことになるので3番目の方法がおすすめです。


作成した電子書籍ファイルの中は以下のように、句読点ごとにHTMLのspanタグで区切られています。

image


文章によって句読点と鉤括弧類(「」『』)の規則が違うので不整合を起こす可能性があります。ここで一度epubcheckを使って電子書籍ファイルのエラーをチェックしてください(サンプルファイルではエラーもなく問題はありません)

ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。

perl epub_check.pl 20151213151805.epub

※「20151213151805.epub」は作成した電子書籍ファイル名です。

image

「エラーも警告も検出されませんでした」と表示されたら電子書籍は問題なく作成されています。

(初めてepub_check.plを起動すると、epubcheckの最新版をダウンロードしますので、少し時間がかかります)



次に「say_prepare.pl」を使って、読み上げる文章をピックアップします。

ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。

perl say_prepare.pl

image


SPAN:498:WORD:498 ...count OK

という表示が続いてます。

これは、句読点句切りからピックアップした文の数が合っているかのチェックです。「OK」と表示されていたら問題はありません。

NGと表示されていたら元の文章をご確認ください(だった。」』そして、などと句読点や鉤括弧が複数連続して並ぶとNGになる可能性があります)



say_prepare.plを実行すると、easy_epubフォルダの中に「_voice」というフォルダが作られます。

image

_voiceフォルダの中には以下の3つのファイル、フォルダがあります。

・_span_split_txtというテキストファイル

・multimediaという空のフォルダ

・textという本文テキストの入ったフォルダ


textフォルダに入っている本文は、句読点句切りの電子書籍ファイルに句読点単位でIDをつけています。

image


「_span_split.txt」というテキストファイルが読み上げる文章を記述したファイルです。

image

textフォルダの本文についているIDと、句読点で区切られた文章が一行ずつ並べられています(タブ句切り、文字コードutf8 BOM無)


このファイルを元に音声ファイルを作ります。

say_easy_epubでは、ルビがふってある文字はルビを読みとして_span_split.txtに登録しますが、ルビ以外のところで合成音声の読み間違いなどがあります(「町」「まち」を「ちょう」と読む)

読み間違いや人名、当て字など、この_span_split.txtで平仮名に直したりしながら編集・修正していきます。



音声付き電子書籍の作り方【7】「【制作編】音声ファイルを作る」に続く。

<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】