WINDOWSの音声合成Harukaさんは有能だ

2015/10/13 [19:43:35] (火) 天気

音声合成ネタ。

WINDOWSも8から音声合成エンジンがデフォルトで利用可能になったとか(わたしはいまだにwindows7なので伝聞情報)

その日本語音声のHarukaは、ユーザー補助のテキスト読み上げに使われているもので、かなり自然に聞きとれる。macもそうだけど、こういうところは、アメリカさんは、きちんとしっかり対応するんだなあ、と素直に感心してしまった。


マイクロソフトの取り組みとしては


【Microsoft】日本語音声合成エンジンのご提供について

http://www.microsoft.com/ja-jp/enable/products/7narrator/default.aspx

マイクロソフトでは、障碍 (しょうがい) のある方のパソコン活用に役立てていただくため、日本語音声合成エンジンを無償 (数量限定) でご提供します


という記事が2010年ごろ(?)に上がっていたようだ。


てことで、試したくなったので、検索してみたらば、もう5年以上も前からいろんなブログや掲示板などでノウハウが公開、蓄積されていた…おのれの不勉強に今さらながら呆れてしまう。


無料の音声合成エンジン 「Microsoft Speech Platform 11」

http://mahoro-ba.net/e1541.html

SAPI有効にする方法

http://yarimasu.ankochan.net/d/SAPI%CD%AD%B8%FA%A4%CB%A4%B9%A4%EB%CA%FD%CB%A1

Windows7で音声合成(Text to speech)

http://blog.mogya.com/2012/01/windows7text-to-speech.html

↑こちらのページを参考にWINDOWS7のネットブックにHarukaをインストールした(有用な情報ありがとうございます)


やることは3つ


・Microsoft Speech Platformのインストール

http://www.microsoft.com/download/en/details.aspx?id=27225

x64_SpeechPlatformRuntime.msi(64bit)

x86_SpeechPlatformRuntime.msi(32bit)

↑どっちか。


・TTS音声Harukaのインストール

http://www.microsoft.com/download/en/details.aspx?id=27224

MSSpeech_TTS_ja-JP_Haruka.msi


・レジストリの設定

上記のページを参考に。コマンドプロンプトを管理者モードで立ち上げて


reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v11.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens /s /f 

↑をコピペして実行



このユーザー補助に使われる音声、macはコマンドラインでsayコマンドを使えば簡単に利用できたんだけど、WINDOWSがちょっとわからず、結局またperl(Active PerlでWin32)から使うことになってしまった。


use Win32::OLE;
my $str = ’悪人にも,善人にも,卑劣漢にも,正直者にも,英雄にも,虫けらにもなれなかった’;
my $f   = ’20151013.wav’;
my $tts = Win32::OLE->new(’Sapi.SpVoice’) || die;
my $fs  = Win32::OLE->new(’Sapi.SpFileStream’) || die;
$fs->{Format}->{Type} = 18;
$fs->Open($f, 3, 0);
$tts->{Voice} = $tts->GetVoices->Item(1);
$tts->{AudioOutputStream} = $fs;
$tts->Speak(Encode::encode(’shiftjis’, $str));
$tts->WaitUntilDone(-1);
$fs->Close();

読ませたのは『地下生活者の手記』ドストエーフスキイ・米川正夫訳の一節。


「悪人にも、善人にも、卑劣漢にも、正直者にも、英雄にも、虫けらにもなれなかった」


WINDOWSとMacの音声聞き比べ。


「WINDOWS7 SAPI5 Haruka」

「Mac sayコマンド」


WINDOWSもmacも。

OSのデフォルトレベルでここまで聞きとりやすくなってんだなあ。


電子書籍でいうと、これに人名や当て字、ルビを読めれば十分だし、さらに読み上げている箇所のハイライト表示とか、それらの仕込みも実は進んでるんじゃないか。となると、マルチメディアDAISY図書やmedia overlaysによる音声付きEPUB3電子書籍は過渡期の徒花かも。

image

[更新]2015-10-16 10:33:32

twitter API 1.0から1.1へ移行メモ

2012/10/13 [16:44:37] (土) 天気

12日の明け方に、今まで使えていたエンドポイント(APIのURL)が使えなくなりあちらこちらで話題になっていた。具体的には

ttp://twitter.com/statuses/user_timeline/NNNNNN.xml

が使えなくなり

ttps://api.twitter.com/1/statuses/user_timeline.json

ttps://api.twitter.com/1.1/statuses/user_timeline.json

と、APIバージョンつきのURLを使ってね、ということ。

twitter公式発表だと、API 1.0 が使えるのは2013年3月までなので、この際ウチで使ってるtwitterのAPIなども1.1に変更した。

一次情報はこちら

https://dev.twitter.com

https://dev.twitter.com/docs/api/1.1


今まで意図通りに動いているスクリプト類は、1.1のエンドポイントに変更するだけでほぼOK。心配するほど大きな変更はなかった。

うちの場合データ取得などは、すべてXMLでやっていて、公式発表によると、RSS XMLは廃止、なので、jsonでの取得に切り替えた。twitterの公式ページには具体的なリクエストやパラメータなどが載っていて、サンプルもあって助かった。

mentions → mentions_timeline とバージョン番号の有無以外に変更になったAPIや廃止されたAPIもあるので、それは公式サイトを参照ください。


perlで作ったスクリプトでひとつひっかかったのがPOST。

1.0と同じデータを1.1のエンドポイントにリクエストすると、BadRequest 400が返ってくる。code 215エラーとか。1.0だと問題なかったのになんじゃそりゃ、と検索しまくってもそれらしい問題は出てこない。GETで取得するものは大丈夫。てことはOAuthでPOSTのリクエストに変更があったのか、と公式ページから辿ってみるとOAuthに関して、1.1は1.0よりもstrictになったらしい。でも、それならほかの開発者からも呪いの声が上がってるはず。公式ページを読んでも、OAuthのデータの作り方は今までと同じで問題ない。

あれこれ検索したり、CPANからNet::Twitterをダウンロードして眺めてみて、結論。


画像など添付のため、multipart form-data形式でのPOSTを受け付けるようになっていて、このPOSTは form-data なのか普通の(?)application/x-www-form-urlencoded なのかを明示する必要があったようだ。


これまでHTTPのヘッダのcontent_typeは何も指定せずそのまま通ってたんだけど


$req = HTTP::Request(POST, URL, POSTDATA )
$req->content_type(application/x-www-form-urlencoded)

と、指定することで無事解決。…ほぼ一日ハマってしまった。


POSTリクエストの一次情報はこちら

https://dev.twitter.com/docs/auth/creating-signature


昨日、WEBの表に出てるところは、すぐに気づいて直してまわって、やれやれ終わったぜ、と思ってたら、cronで使ってるものがあってすっかり忘れてた。


cronで使ってたのは「趣味は読書2」という公開中のWEB本棚サービスのtwitter連携。

twitterで本のタイトルや、著者名をつぶやくと、その本がすでに本棚に入ってるかどうかをリプライする。二重買い防止のため、本屋さんなどで「うーん、これ読んだっけ?」な時に重宝してる機能だった。


ポケット詳解WebAPI辞典 (Pocket詳解)

『ポケット詳解WebAPI辞典 (Pocket詳解)』

3Dogs

[更新]2026-02-02 08:11:23

googleがAjax部分も登録?

2009/10/13 [20:17:35] (火) 天気

検索エンジンのクローラーはjavascriptを実行できるわけじゃないので、Ajaxで作られたコンテンツは検索エンジンにとっては「存在しない」…なもんで、検索エンジンからの集客が中心のECサイトなんかはAjaxは鬼門だった。検索エンジンに縛られて、面白い・使いやすいサイトができなくてどうする。本末転倒。

googleがAjax部分もクロールできる・検索エンジンに登録できるようにする、というので見てみた。

http://www.sem-r.com/seo/20091008202855.html

結局、Javascriptを適用した後のコンテンツを用意しろよ、ということ。なんじゃそりゃ。うううむ。まだまだAjaxは使えないじゃん。


phpをちょろっといじってページ作り。phpって変数の範囲がわかりにくい、ような気がする。requireされてる先まで見に行かなきゃいけないことがけっこうあって、探し物をしている時間が長い感じ。やっぱりperlが好きだ。


[10/14 00:14:23]

twitterのストリーミング実況を導入。

http://yusukebe.com/archives/09/09/26/200713.html

こちらのおかげです。おもしれー


[更新]2026-02-04 09:17:01

フィルムスキャン終了、かな

2008/10/13 [16:47:56] (月) 天気

手元のフィルムをとりあえずスキャン終了。800枚弱程度、かな。プラモデルカメラの精度の悪さなのかAGFAとの相性なのか、コマ送りの間隔のバラつきがひどくてまともにスキャンできなかったフィルムも何本か。うーん、これはもったいないなぁ。使いまわしの気楽さは一番だったんで、プラモデルカメラではけっこうパシャパシャやってたんだよねえ。


で、改めて眺めてみると、どのカメラもけっこう個性があって面白いもんだ。どうも釈然としなかったVivitarUltraWideSlimも、予想通り、水元公園だと威力本領発揮。まだ現像してないのは、亀有アリオのヴィレッジバンガード系雑貨屋で買った無名のプラスチックレンズ28mmトイカメラ防水カバーつき1400円也、なんだけど、これはプラスチックレンズ広角28mmってことでプラモデルカメラと同じはず(壊れたプラモデルカメラの後継として買ったわけだし)。F9でシャッター速度は125のはずで、そこにモノクロのISO1600なんてのを入れたもんだから、いつ撮ればいいものか、見当つかずだらだら放置状態。難しいのを入れちゃったなぁ。


image
VQ1005

てことで、週末は合羽橋道具祭り&浅草経由秋葉原とか水元公園とか。激しい客引きの煮込み系飲み屋路地を通りぬけ、地下のワイン売り場で売ってるワインをプラス500円で持ち込みOKのレストランで、まったり赤ワインを一本空けて、ウチでは春鹿を空けて、と正しく飲んだくれ。


今日は一日ぼーっと、昼前に、亀有のラーゾでテイクアウトして、あとは引きこもり。Xboxとかスキャニングで過ごす。通販で買ったグーテンドラークとかシメイが届いたので、やっぱり飲みながらだ。


立て続けにスキャニングするのはさすがにメンドーだったなぁ。


[更新]2026-02-04 09:38:23

秋晴れは気持ちいいです

2005/10/13 [21:41:21] (木) 天気

すまんかったです。ここんとこエラソなクチ叩いてるのに、今日から着手してるのは全体を2つに分けるため、大きなテーブルでひとくくり。おまけにリンクのためだけに画像をこしらえてたり、それもonmouseoverのためにふたつ読み込み。

言ってることとやってることがここまで真逆でいっそすがすがしい秋晴れの一日でございます。恐らく要求されるであろうことを考えるとこうなってしまう、のかなぁ。

テーブルでやってるのはcssの使いどころとブラウザでの互換を把握してないから。不勉強ということ。

画像を使うのは、うううむ、こっちの方がウケがいいんだよなぁ。としか言いようがない。


ちょっと気になって本屋で立ち読み。もはやHTMLでもなくXHTMLだそうだ(…ってこれ、もう何年も前から言われてることじゃなかったっけか)XMLとかRDFとかこっちはこっちであれこれあるし。動画系というか google mapなんかでも使われる ajax というのが出てきて下手すると flash を食ってしまいそうだし。

おっさんにはついていけないスピードだ。ネットがあちこち繋がることで、あちこちにばらけてたキレる連中が情報を得てさらにキレて、情報の量が増えるだけじゃなく質も高くなった結果か。

意図したものではないだろうけど、そんなに急いでどこえゆく、だなぁ。


そういや昨日も書いたネット企業のコンテンツ乞食。ヤフーもライブドアも自前でコンテンツを作ろうとはしないで、既存のものを食いつぶすやりくちぢゃん、とか思ってたら今度は楽天かい。「志」なんて死語を持ち出したくなる。

[更新]2026-02-04 11:09:17

<<2026/10>>
    123
45678910
11121314151617
18192021222324
25262728293031

【最近の10件】

日常読書映画アニメゲーム健康料理グルメカメラ写真ネタ仕事パソコンインターネットperlEPUB3電子書籍ActivityPub
検索: