音声の校正修正

2015/3/9 [20:01:34] (月) 天気

電子書籍につける音声の調整については先日雑記に書いたとおり。

正解が分からないのでキリがない、というところ。ていうか、正解はあるんだろうか。


日本語の文法や言葉づかいとはまた別の「音」の世界。

鼻濁音とか無声音とかそこには別の概念があるようで知的好奇心(とかいうとカッコつけてるけどひらたく「野次馬根性」)を刺激される。

ひとつのコンテンツがいくつものレイヤーでその各々のメソッドで解釈されうるてことだよねえ(胡散臭いカタカナがみっつもあるのは勘弁してください)


読み上げ音声に関して、NHKの訓練されたアナウンサーでも「これでOK」とは言えないような気がする。実際にどのようなスタッフで共有して作成しているのか知らないけど、朗読会やDAISY図書は「正しい」音声をどういう扱いでやってるんだろう(興味津々)


今日、公開した音声付き電子書籍「苺の泉」(『猟人日記』ツルゲーネフ)

http://t2aki.doncha.net/?id=1425130349

は、句読点でバラしたフレーズが765個。今回はあきらかな読み間違いだけではなく、ちょっと頑張って765個の音声を聞いてイントネーションの調整もやってみた。


最低一回は聞く。読み上げる時間がそのまま最低限必要な時間で、読み間違いがあったら修正してそれを再生して確認する。イントネーションの調整もはいると、そのつど、修正+再生確認となる。

週末の一日をほぼこれで潰すこととなった(にもかかわらず、誤植誤読はあると思う)


でも、そもそも、その修正は正しいの?

…という疑問・疑惑が抜けきれない世界だ。


こいつを作業フローとして眺めると。

単純な「作業」にはならない。複数のスタッフで分担できるんだろうか。チェックボックスにチェックして次に回す、てな仕事にはならない。

めちゃくちゃ属人的(ひと頼み)の仕事にみえる。


音声合成、人工音声を使えば、従来の朗読音声を組み込むのと比べると格段に早いというのは分かるけど、それでもそんなに簡単なものじゃないなあ、というのが、今回ちょっと頑張って作ってみた実感。


わたしが使ってるのはSofTalk経由でAquestの音声合成エンジン。

SofTalkや棒読みちゃんに使われているし(素人だけど)わたしも納得の音声が得られる。


それなりの音声合成ソフト(ボイスソムリエネオやAITalkなど定評のある音声合成ソフト)を使っても同じこと。結局は微調整がはいる(「微」調整)といったって「やりなおし」には違いない、同じこと。

結局のところ、ひとがその音声を聞いて確認・修正する必要があるんだからね。



決して他人事じゃなくて。

わたしは、あまり目が強くないようで、音声付き電子書籍には期待するところがある。


両目とも歳を食ってから

「網膜血管硬化症」「網脈絡膜萎縮」

といった診断をされていて、さらに片目は盲点があって見えないブラックホールがあるらしい(…とか言われてもよくわからんのだけど)たぶん、緑内障、網膜剥離のリスクをかかえてるんだろう。

『網膜血管硬化症と網脈絡膜萎縮』

『週末を堪能…かな』


先週末あたりから、視界の中、細い白く光るロープが縄跳びをしているのを見るようになったんで、ビビって、今日6年ぶりだかで地元の眼科に行った。

とりあえず、網膜剥離も眼底出血も見られないので、まだ大丈夫らしい。…でもなあ。いつこの目がアウト宣告されるか分かったもんじゃないんで、音声付き電子書籍の普及を願いたい。

<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】