音声合成聞き比べ
ちょっと検索するだけでもいろいろ出てくる合成音声ソフト。
有料のものは、現時点では、なかなか個人が趣味で気軽に手を出せる金額ではなさそう(だいたいどこも50万円あたりという噂)なんだけど、どんなものかちょっと聞くだけは聞ける。すっぱい葡萄。
どれもWEBで体験・お試しページがあって、とりあえず青空文庫『ドグラマグラ』の冒頭を読み上げてもらったのが以下。
…………ブウウ――――――ンンン――――――ンンンン………………。
私がウスウスと眼を覚ました時、こうした蜜蜂の唸るような音は、まだ、その弾力の深い余韻を、私の耳の穴の中にハッキリと引き残していた。
AITalk
https://www.ai-j.jp/
VOICETEXT
https://voicetext.jp/
ボイスソムリエネオ
https://www.hitachi-solutions-business.co.jp/products/package/sound/voice/
アクセントもイントネーションも、これなら十分すぎるぐらいイケてる。こんなに聞きとりやすいんだと、どれにもちょっと吃驚。ほとんど違和感がない。
(ボイスソムリエネオは辞書?日本語解析?が弱いっぽく、読み間違いがあるけど)
さすが、金・人・時間をかっちりかけて企業が開発しただけのことはあるなあ。研究開発費が回収できたら、一般向けに廉価版を販売してくれないかしらん…。
以下のふたつはフリーの音声合成。
(macのVoiceOverのシステム音声は「フリー」じゃないけど「無料」という意味の方で)
macのVoiceOver
Windowsで棒読みちゃん
https://chi.usamimi.info/Program/Application/BouyomiChan/
アクセントもイントネーションも違和感がある。
上記の商用アプリと比較すると「機械やなあ」
でも、実のところ、わたしはこれはこれでOKだと思っている。
たぶん、アニメや特撮を見て育ったこともあるんだろう。ロボット、機械がしゃべるシーンをたくさん見てきた。「未来」はこんな感じだったよなあ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
音声の校正修正
電子書籍につける音声の調整については先日雑記に書いたとおり。
正解が分からないのでキリがない、というところ。ていうか、正解はあるんだろうか。
日本語の文法や言葉づかいとはまた別の「音」の世界。
鼻濁音とか無声音とかそこには別の概念があるようで知的好奇心(とかいうとカッコつけてるけどひらたく「野次馬根性」)を刺激される。
ひとつのコンテンツがいくつものレイヤーでその各々のメソッドで解釈されうるてことだよねえ(胡散臭いカタカナがみっつもあるのは勘弁してください)
読み上げ音声に関して、NHKの訓練されたアナウンサーでも「これでOK」とは言えないような気がする。実際にどのようなスタッフで共有して作成しているのか知らないけど、朗読会やDAISY図書は「正しい」音声をどういう扱いでやってるんだろう(興味津々)
今日、公開した音声付き電子書籍「苺の泉」(『猟人日記』ツルゲーネフ)
https://t2aki.doncha.net/?id=1425130349
は、句読点でバラしたフレーズが765個。今回はあきらかな読み間違いだけではなく、ちょっと頑張って765個の音声を聞いてイントネーションの調整もやってみた。
最低一回は聞く。読み上げる時間がそのまま最低限必要な時間で、読み間違いがあったら修正してそれを再生して確認する。イントネーションの調整もはいると、そのつど、修正+再生確認となる。
週末の一日をほぼこれで潰すこととなった(にもかかわらず、誤植誤読はあると思う)
でも、そもそも、その修正は正しいの?
…という疑問・疑惑が抜けきれない世界だ。
こいつを作業フローとして眺めると。
単純な「作業」にはならない。複数のスタッフで分担できるんだろうか。チェックボックスにチェックして次に回す、てな仕事にはならない。
めちゃくちゃ属人的(ひと頼み)の仕事にみえる。
音声合成、人工音声を使えば、従来の朗読音声を組み込むのと比べると格段に早いというのは分かるけど、それでもそんなに簡単なものじゃないなあ、というのが、今回ちょっと頑張って作ってみた実感。
わたしが使ってるのはSofTalk経由でAquestの音声合成エンジン。
SofTalkや棒読みちゃんに使われているし(素人だけど)わたしも納得の音声が得られる。
それなりの音声合成ソフト(ボイスソムリエネオやAITalkなど定評のある音声合成ソフト)を使っても同じこと。結局は微調整がはいる(「微」調整)といったって「やりなおし」には違いない、同じこと。
結局のところ、ひとがその音声を聞いて確認・修正する必要があるんだからね。
決して他人事じゃなくて。
わたしは、あまり目が強くないようで、音声付き電子書籍には期待するところがある。
両目とも歳を食ってから
「網膜血管硬化症」「網脈絡膜萎縮」
といった診断をされていて、さらに片目は盲点があって見えないブラックホールがあるらしい(…とか言われてもよくわからんのだけど)たぶん、緑内障、網膜剥離のリスクをかかえてるんだろう。
『網膜血管硬化症と網脈絡膜萎縮』
『週末を堪能…かな』
先週末あたりから、視界の中、細い白く光るロープが縄跳びをしているのを見るようになったんで、ビビって、今日6年ぶりだかで地元の眼科に行った。
とりあえず、網膜剥離も眼底出血も見られないので、まだ大丈夫らしい。…でもなあ。いつこの目がアウト宣告されるか分かったもんじゃないんで、音声付き電子書籍の普及を願いたい。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
何やら事件の痕と茶色の食卓
近所のいつもカモがいる人工の池。
先日行ってみたら、カモの羽が水面に散乱していて驚いた。
犬も猫も多いので何か起こったのかも知れない…梨木香歩の『ピスタチオ』的なことを考察してみようと思ったけど、わたしはただの無職初老、あの発想・描写はとても無理。
ああ、いよいよ食うに困ったらこっそりこいつらを絞めて食材にすることになるんだなぁ、ぐらいの感慨。
ここ最近の自作料理はほとんど茶色。
出汁を取って刻んだ昆布、縮緬ジャコ、沢庵の微塵切りを胡麻油で炒めたもの。
醤油・味醂・鷹の爪・胡椒。
濃いめで白米にピッタリ…これだけでモリモリ2膳は食える。
腿肉からひっぺがした鶏皮を煎餅に。
鶏皮煎餅で出た油で薄切りにした椎茸を炒めたもの。
ニンニク・鷹の爪・塩・胡椒・醤油・マーガリン。
鶏皮煎餅はもちろん、椎茸炒めは当然のようにコクがあってツマミにピッタリだった。
鶏皮と切干し大根をトウチで炒めたもの。
塩・胡椒・鷹の爪。
切干し大根にしっかり味がつくのでトウチの勝利。
ほうれん草としめじをホワイトソースで炒め煮。
ホワイトソースはテキトー目分量。牛乳を入れて小麦粉(薄力粉)を混ぜてトロっとしたらできあがり。
塩・胡椒・コンソメ。
ほうれん草を一束、むしゃむしゃ食って腹いっぱいだった。
トマトとタマネギの炒めもの。
タマネギをコンソメでしっかり炒めて、トマトは余熱で。
塩・胡椒。
トマトは熱を加えると甘味が増す、ような気がする。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
電子書籍につける音声の調教
「SofTalk」も「棒読みちゃん」もイントネーションやアクセントの調整ができる。
というか、両ソフトが利用しているAquestの音声ライブラリが音声の調整をしている。Aquest社のサイトに仕様書があって、それを読むと音声の細かい調整が可能で、単純な棒読みではなく、それっぽい読み上げ音声にしあがる。
Aquestの音声記号列仕様書
https://www.a-quest.com/download/manual/siyo_onseikigou.pdf (※PDF)
文章をそのまま読ませてみた。
「私がウスウスと眼を覚ました時、こうしたみつばちのうなるような音は、まだ、その弾力の深い余韻を、私の耳の中にハッキリと引き残していた。」
・「眼」を「がん」と読んでいる
・「こうした」は「こーした」の方が聞きとりやすい
・「時、」「は、」「を、」など読点直前の音が上がってしまっている。
音声記号でアクセントや区切りを指定した。
「私が,ウスウスと/めを覚ましたと'き,こーしたみつばちのうなるような音'わ,ま'だ,その弾力の深い余韻を、私の耳の穴の中にハッキリと引き残していた。」
これは、それっぽく聞きとれる。
語尾上がりになっていたところ(「とき」の「と」など)にアクセントを入れただけでずいぶん聞き取りやすくなった。
アクセントとポーズを調整するだけでかなり音声のクオリティは上がる。
なんでこんなこと調べたかというと。
今、スクリプトで作った音声付き電子書籍は句読点単位でバラして音声を作っている。
もしかして、センテンス(もっと長文)ごとで音声を付けた方が、SofTalkや棒読みちゃんがそれっぽく音声記号をつけてAquestのライブラリに渡してくれて自然な読みになるのでは、と。
でもやっぱり、それなりの調教は必要だなあ。ラクな道はないようで…。
ちなみに句読点単位でバラした方がそれっぽい、かも。
読点直前の語尾上がりがおさまっている…て、バラす時に読点を削除してるのでその副作用だけどね。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
「眼聴耳視」音声付き電子書籍公開リスト
音声で読み上げているところをハイライト表示するEPUB3電子書籍。
読む箇所を目で追って、同時にその部分が読み上げられ。視覚と聴覚、ふたつの感覚を駆使して読む読書体験は刺激的です。
これは、視覚に障害のあるかたや、識字障害のあるかたの読書として有用だと言われています。
人工音声による音声付き電子書籍を作ってこのページで随時公開します。
【ツルゲーネフ】
『猟人日記』ホーリとカリーヌィチ (2015/2/28)
https://t2aki.doncha.net/release/ryojin-nikki01-20150228.epub
(底本:『猟人日記』ツルゲーネフ 著/中山省三郎 訳 角川文庫 平成2年11月15日 4版)
『猟人日記』エルモライと粉屋の女房 (2015/2/28)
https://t2aki.doncha.net/release/ryojin-nikki02-20150228.epub
(底本:『猟人日記』ツルゲーネフ 著/中山省三郎 訳 角川文庫 平成2年11月15日 4版)
『猟人日記』苺の泉 [2015/03/09 14:38:58]
https://t2aki.doncha.net/release/ryojin-nikki03-20150309.epub
(底本:『猟人日記』ツルゲーネフ 著/中山省三郎 訳 角川文庫 平成2年11月15日 4版)
『猟人日記』郡の医者 [2015/03/16 00:31:06]
https://t2aki.doncha.net/release/ryojin-nikki04-20150316.epub
(底本:『猟人日記』ツルゲーネフ 著/中山省三郎 訳 角川文庫 平成2年11月15日 4版)
『猟人日記』わが隣人ラヂーロフ [2015/03/17 18:32:31]
https://t2aki.doncha.net/release/ryojin-nikki05-20150317.epub
(底本:『猟人日記』ツルゲーネフ 著/中山省三郎 訳 角川文庫 平成2年11月15日 4版)
【ドストエフスキー】
『キリストのヨルカに召された少年』 (2015/2/28)
https://t2aki.doncha.net/release/dst-shortstory01-20150228.epub
(元テキストは青空文庫 https://www.aozora.gr.jp/cards/000363/card47042.html)
『百姓マレイ』 (2015/2/28)
https://t2aki.doncha.net/release/dst-shortstory02-20150228.epub
(元テキストは青空文庫 https://www.aozora.gr.jp/cards/000363/card47043.html)
上記、読みが違ってるぞ!とか、そもそも誤植じゃねえか、というのがあれば教えていただけるとうれしいです。
不定期、随時になりますが、このページでタイトルを追加していこう思っています。
肉声による朗読ではなく、人工の音声合成でよければ、音声付きで読みたい!という本のリクエストなど、このページのコメントや問い合わせフォーム、メールでご連絡ください。
権利的に公開しても問題のないものであれば作って追加公開します。
(特に旧字旧仮名づかいのものは時間がかかります。また、もしかするとファイルサイズの制限などで難しいものがあるかもしれません)
音声付き電子書籍を再生。
デスクトップ、PC&macの場合
google chrome の Readium
https://chrome.google.com/webstore/detail/readium/fepbnnnkkadjhjahcafoaglimekefifl?hl=ja
スマホやタブレット(Android)の場合
Himawari Reader
https://play.google.com/store/apps/details?id=jp.green_fld.himawari&hl=ja
音声合成の制作には。
SofTalk
https://www35.atwiki.jp/softalk/pages/1.html
棒読みちゃん
https://chi.usamimi.info/Program/Application/BouyomiChan/
の、ふたつを利用させていただいています。ありがとうございます。
また、青空文庫(https://www.aozora.gr.jp)の成果、蓄積にはほんとうに感謝します。ありがとうございます。
ちなみに。
WINDWOSもmacもシステムの合成音声はかなり聞きとりやすいです。システムの音声を利用して音声付き電子書籍を作成してみてはいかがでしょう。
「WINDOWS7」
「Mac」
→ 「media overlaysによる音声付き電子書籍の作成」
下準備が必要ですが、難しいことではなく(面倒ですが)手順どおりに作業すれば音声付き電子書籍を作成できます。
※今日時点 [2015/03/23 22:38:15] kindleやibooksなどは、media overlaysによる音声付き電子書籍の音声再生はできませんが、他の電子書籍と同じように読むことはできます。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
音声付き電子書籍「ホーリとカリーヌィチ」公開
実はわたしはmixiでツルゲーネフコミュの管理人…て、mixiはもう年単位でログインしてないのでアレダケドナー。
トルストイやドストエフスキーはともかく、ツルゲーネフってなんかイマイチ地味なんだけど『猟人日記』は好きで、この雑記でも何度か取り上げてたり。
『猟人日記』ツルゲーネフの写経
角川文庫、中山省三郎 訳の『猟人日記』が2006年で著作権切れ、ということで2008年にAmazonで古本で購入しておいた。箱入り(?)の上下二冊(平成 二年 四版)
写経済みの4編の中から、冒頭の「ホーリとカリーヌィチ」を音声付き電子書籍にしたので公開します。
・テキストは著作権切れ
・カバーの肖像画(ワシーリー・ペロフ)も著作権切れ
・WindowsのSofTalkでつけた音声は個人の非商用利用はOK
なので、たぶん公開条件クリア。マズければ削除しますのでご指摘ください。
(今の時代に差別語と取られている表現がありますが、発表当時の原文を生かしました)
https://t2aki.doncha.net/release/ryojin-nikki01-20150226.epub
↑音声付き電子書籍『ホーリとカリーヌィチ』はこちら
これを音声読み上げしながら・読み上げ部分をハイライトしながら、読む・聞くには今日時点だと以下の2つ。
デスクトップ、PC&macの場合
google chrome の Readium
https://chrome.google.com/webstore/detail/readium/fepbnnnkkadjhjahcafoaglimekefifl?hl=ja
スマホ(Android)の場合
Himawari Reader
https://play.google.com/store/apps/details?id=jp.green_fld.himawari&hl=ja
読み上げの完成度をどこに設定するのか、ということになると思うんだけど。
読み間違いの校正は最低限するとして、イントネーションやアクセントの調整は拘らない、この「猟人日記」レベルでOKということであれば、割りとスグに「読みたいひとに届けることができる」
音声の商用での利用はNGなので(商用となるとライセンスなど別途けっこうなコストになるので)ボランティアベースで地元のNPOを探して参加させてもらうかなあ。
あ。肝心なことを書き忘れた。
猟人日記はハマるので読むべし!!
[2015/02/27 22:18:21] 追記。
「棒読みちゃん」
https://chi.usamimi.info/Program/Application/BouyomiChan/
が、SofTalkと同じく音声合成ライブラリにアクエスト社が無償提供してくれている
「AquesTalk(https://www.a-quest.com/aquestalk)」
を使っているんだけど。
あえてSofTalkのものより古いバージョンのものを使っていて
※当ソフトが利用しているのは、旧版のAquesTalk(Win用)です。
最新版のAquesTalkとは利用規約が異なります。
旧版のAquesTalk(Win用)は、営利・非営利を問わず無償で利用できます。
詳しくは、AquesTalkフォルダ配下にあるAqLicense.txtをご覧下さい。
これを使えば音声をつけた電子書籍などの扱いについては制約はないっぽい。
AqLicense.txt
■複製・再配布
ユーザーは、本ソフトウェアのパッケージを個人利用、商用利用を問わず複製、再配布することができます。
「DLLの再配布」の規定を除き、当社から配布されたものと異なるパッケージや部分的な配布はできません。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」