WINDOWSの音声合成Harukaさんは有能だ

2015/10/13 [19:43:35] (火) 天気

音声合成ネタ。

WINDOWSも8から音声合成エンジンがデフォルトで利用可能になったとか(わたしはいまだにwindows7なので伝聞情報)

その日本語音声のHarukaは、ユーザー補助のテキスト読み上げに使われているもので、かなり自然に聞きとれる。macもそうだけど、こういうところは、アメリカさんは、きちんとしっかり対応するんだなあ、と素直に感心してしまった。


マイクロソフトの取り組みとしては


【Microsoft】日本語音声合成エンジンのご提供について

http://www.microsoft.com/ja-jp/enable/products/7narrator/default.aspx

マイクロソフトでは、障碍 (しょうがい) のある方のパソコン活用に役立てていただくため、日本語音声合成エンジンを無償 (数量限定) でご提供します


という記事が2010年ごろ(?)に上がっていたようだ。


てことで、試したくなったので、検索してみたらば、もう5年以上も前からいろんなブログや掲示板などでノウハウが公開、蓄積されていた…おのれの不勉強に今さらながら呆れてしまう。


無料の音声合成エンジン 「Microsoft Speech Platform 11」

http://mahoro-ba.net/e1541.html

SAPI有効にする方法

http://yarimasu.ankochan.net/d/SAPI%CD%AD%B8%FA%A4%CB%A4%B9%A4%EB%CA%FD%CB%A1

Windows7で音声合成(Text to speech)

http://blog.mogya.com/2012/01/windows7text-to-speech.html

↑こちらのページを参考にWINDOWS7のネットブックにHarukaをインストールした(有用な情報ありがとうございます)


やることは3つ


・Microsoft Speech Platformのインストール

http://www.microsoft.com/download/en/details.aspx?id=27225

x64_SpeechPlatformRuntime.msi(64bit)

x86_SpeechPlatformRuntime.msi(32bit)

↑どっちか。


・TTS音声Harukaのインストール

http://www.microsoft.com/download/en/details.aspx?id=27224

MSSpeech_TTS_ja-JP_Haruka.msi


・レジストリの設定

上記のページを参考に。コマンドプロンプトを管理者モードで立ち上げて


reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v11.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens /s /f 

↑をコピペして実行



このユーザー補助に使われる音声、macはコマンドラインでsayコマンドを使えば簡単に利用できたんだけど、WINDOWSがちょっとわからず、結局またperl(Active PerlでWin32)から使うことになってしまった。


use Win32::OLE;
my $str = ’悪人にも,善人にも,卑劣漢にも,正直者にも,英雄にも,虫けらにもなれなかった’;
my $f   = ’20151013.wav’;
my $tts = Win32::OLE->new(’Sapi.SpVoice’) || die;
my $fs  = Win32::OLE->new(’Sapi.SpFileStream’) || die;
$fs->{Format}->{Type} = 18;
$fs->Open($f, 3, 0);
$tts->{Voice} = $tts->GetVoices->Item(1);
$tts->{AudioOutputStream} = $fs;
$tts->Speak(Encode::encode(’shiftjis’, $str));
$tts->WaitUntilDone(-1);
$fs->Close();

読ませたのは『地下生活者の手記』ドストエーフスキイ・米川正夫訳の一節。


「悪人にも、善人にも、卑劣漢にも、正直者にも、英雄にも、虫けらにもなれなかった」


WINDOWSとMacの音声聞き比べ。


「WINDOWS7 SAPI5 Haruka」

「Mac sayコマンド」


WINDOWSもmacも。

OSのデフォルトレベルでここまで聞きとりやすくなってんだなあ。


電子書籍でいうと、これに人名や当て字、ルビを読めれば十分だし、さらに読み上げている箇所のハイライト表示とか、それらの仕込みも実は進んでるんじゃないか。となると、マルチメディアDAISY図書やmedia overlaysによる音声付きEPUB3電子書籍は過渡期の徒花かも。

image
<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】