ひまつぶし雑記帖

doncha.net制作・発行:KindleやiBooks、楽天kobo、BOOK☆WALKERで読む電子書籍

音声付き電子書籍の作り方【6】【制作編】読み上げる文章を抽出する

2015/12/17 [07:28:26] (木) 天気

【制作編】読み上げる文章を抽出する

easy_epubフォルダにあるサンプルファイル「text-file」をエディタで開きます。
(拡張子がなくてうまく開けない場合は、拡張子「.txt」をつけて「text-file.txt」としてください)

同梱されているサンプルのテキストファイルです(text-file)
image
このサンプルファイルの冒頭に
((句読点でspanタグ))
(「カッコカッコ句読点でspanタグカッコカッコ」)
という一行を記入してください。句読点「、。」単位で文章をピックアップできるようにします。

((句点でspanタグ))と指定すると、句点「。」単位になります。
長編などで句読点単位だと音声ファイルが細かくて多くなりすぎたり、HarukaやOtoyaが短かい文章だと読み間違いしてしまうような時に、句点単位の方が良い場合もあります。

また、WINDOWSの場合は、say_easy_epubで音声をつける時にひとつの音声の最後に少しマージンの間が入ってしまうので、句読点単位よりも句点単位で区切った方が聞きやすくなります。

image
一行記入したサンプルファイルを保存したら、easy_epubの以下いずれかの方法で電子書籍ファイルを作ります。

1)EasyEpub.appにtext-fileをドラッグ&ドロップ(Mac)
2)easy_epub.batにtext-fileをドラッグ&ドロップ(WINDOWS)
3)easy_epubフォルダでターミナルやコマンドプロンプトを開いて
「perl easy_epub.pl text-file」
とキーボード入力(Mac WINDOWS)

この後、ターミナル、コマンドプロンプトを使うことになるので3番目の方法がおすすめです。

作成した電子書籍ファイルの中は以下のように、句読点ごとにHTMLのspanタグで区切られています。
image

文章によって句読点と鉤括弧類(「」『』)の規則が違うので不整合を起こす可能性があります。ここで一度epubcheckを使って電子書籍ファイルのエラーをチェックしてください(サンプルファイルではエラーもなく問題はありません)
ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。
perl epub_check.pl 20151213151805.epub
※「20151213151805.epub」は作成した電子書籍ファイル名です。
image
「エラーも警告も検出されませんでした」と表示されたら電子書籍は問題なく作成されています。
(初めてepub_check.plを起動すると、epubcheckの最新版をダウンロードしますので、少し時間がかかります)


次に「say_prepare.pl」を使って、読み上げる文章をピックアップします。
ターミナル、コマンドプロンプトをeasy_epubフォルダを開いて以下のコマンドをキーボード入力します。
perl say_prepare.pl
image

SPAN:498:WORD:498 ...count OK
という表示が続いてます。
これは、句読点句切りからピックアップした文の数が合っているかのチェックです。「OK」と表示されていたら問題はありません。
NGと表示されていたら元の文章をご確認ください(だった。」』そして、などと句読点や鉤括弧が複数連続して並ぶとNGになる可能性があります)


say_prepare.plを実行すると、easy_epubフォルダの中に「_voice」というフォルダが作られます。
image
_voiceフォルダの中には以下の3つのファイル、フォルダがあります。
・_span_split_txtというテキストファイル
・multimediaという空のフォルダ
・textという本文テキストの入ったフォルダ

textフォルダに入っている本文は、句読点句切りの電子書籍ファイルに句読点単位でIDをつけています。
image

「_span_split.txt」というテキストファイルが読み上げる文章を記述したファイルです。
image
textフォルダの本文についているIDと、句読点で区切られた文章が一行ずつ並べられています(タブ句切り、文字コードutf8 BOM無)

このファイルを元に音声ファイルを作ります。
say_easy_epubでは、ルビがふってある文字はルビを読みとして_span_split.txtに登録しますが、ルビ以外のところで合成音声の読み間違いなどがあります(「町」「まち」を「ちょう」と読む)
読み間違いや人名、当て字など、この_span_split.txtで平仮名に直したりしながら編集・修正していきます。


音声付き電子書籍の作り方【7】「【制作編】音声ファイルを作る」に続く。 【音声付き電子書籍の作り方】
動画で見る音声付き電子書籍の作り方 (2015/2/22)
音声付き電子書籍の作り方【0】音声付き電子書籍のサンプル動画 (2015/12/11)
音声付き電子書籍の作り方【1】【準備編】Macの合成音声 (2015/12/12)
音声付き電子書籍の作り方【2】【準備編】WINDOWSの合成音声 (2015/12/13)
音声付き電子書籍の作り方【3】【準備編】WINDOWSで音声付き電子書籍を作るために (2015/12/14)
音声付き電子書籍の作り方【4】【準備編】easy_epubとsay_easy_epubの設定 (2015/12/15)
音声付き電子書籍の作り方【5】【番外編】コマンドウインドウやターミナルの使いかた (2015/12/16)
音声付き電子書籍の作り方【6】【制作編】読み上げる文章を抽出する (2015/12/17)
音声付き電子書籍の作り方【7】【制作編】音声ファイルを作る (2015/12/18)
音声付き電子書籍の作り方【8】【制作編】音声付きEPUB3電子書籍の完成 (2015/12/19)
音声付き電子書籍の作り方【9】【番外編】青空文庫に音声をつける (2015/12/20)

»電子書籍制作代行についてはこちら

profile

profile

 
doncha.net
contact:
»運営者
@t2aki@tokoroten.doncha.net

ところてんx5

2024/4/27 12:51

図書館で作業。案の定、目視確認は一回じゃ抜け漏れが出る。
一応、最初に確認、反映させた箇所で大丈夫だったけど、これは先が思いやられる。

2024/4/27 08:52

もろもろ、問題山積でやる気が出なくてマズい。久しぶりに図書館の個人席にノパソ持ち込んで作業してみる、か。

2024/4/27 08:50

こっちはこっちで、問題ありあり

検索
<<2024/4>>
 123456
78910111213
14151617181920
21222324252627
282930

リンク

WINDOWS版サウンドノベル
おかえりください PC WINDOWS版サウンドノベル
『おかえりください』体験版