WINDOWSの音声合成Harukaさんは有能だ

2015/10/13 [19:43:35] (火) 天気

音声合成ネタ。

WINDOWSも8から音声合成エンジンがデフォルトで利用可能になったとか(わたしはいまだにwindows7なので伝聞情報)

その日本語音声のHarukaは、ユーザー補助のテキスト読み上げに使われているもので、かなり自然に聞きとれる。macもそうだけど、こういうところは、アメリカさんは、きちんとしっかり対応するんだなあ、と素直に感心してしまった。


マイクロソフトの取り組みとしては


【Microsoft】日本語音声合成エンジンのご提供について

http://www.microsoft.com/ja-jp/enable/products/7narrator/default.aspx

マイクロソフトでは、障碍 (しょうがい) のある方のパソコン活用に役立てていただくため、日本語音声合成エンジンを無償 (数量限定) でご提供します


という記事が2010年ごろ(?)に上がっていたようだ。


てことで、試したくなったので、検索してみたらば、もう5年以上も前からいろんなブログや掲示板などでノウハウが公開、蓄積されていた…おのれの不勉強に今さらながら呆れてしまう。


無料の音声合成エンジン 「Microsoft Speech Platform 11」

http://mahoro-ba.net/e1541.html

SAPI有効にする方法

http://yarimasu.ankochan.net/d/SAPI%CD%AD%B8%FA%A4%CB%A4%B9%A4%EB%CA%FD%CB%A1

Windows7で音声合成(Text to speech)

http://blog.mogya.com/2012/01/windows7text-to-speech.html

↑こちらのページを参考にWINDOWS7のネットブックにHarukaをインストールした(有用な情報ありがとうございます)


やることは3つ


・Microsoft Speech Platformのインストール

http://www.microsoft.com/download/en/details.aspx?id=27225

x64_SpeechPlatformRuntime.msi(64bit)

x86_SpeechPlatformRuntime.msi(32bit)

↑どっちか。


・TTS音声Harukaのインストール

http://www.microsoft.com/download/en/details.aspx?id=27224

MSSpeech_TTS_ja-JP_Haruka.msi


・レジストリの設定

上記のページを参考に。コマンドプロンプトを管理者モードで立ち上げて


reg COPY "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech Server\v11.0\Voices\Tokens" HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech\Voices\Tokens /s /f 

↑をコピペして実行



このユーザー補助に使われる音声、macはコマンドラインでsayコマンドを使えば簡単に利用できたんだけど、WINDOWSがちょっとわからず、結局またperl(Active PerlでWin32)から使うことになってしまった。


use Win32::OLE;
my $str = ’悪人にも,善人にも,卑劣漢にも,正直者にも,英雄にも,虫けらにもなれなかった’;
my $f   = ’20151013.wav’;
my $tts = Win32::OLE->new(’Sapi.SpVoice’) || die;
my $fs  = Win32::OLE->new(’Sapi.SpFileStream’) || die;
$fs->{Format}->{Type} = 18;
$fs->Open($f, 3, 0);
$tts->{Voice} = $tts->GetVoices->Item(1);
$tts->{AudioOutputStream} = $fs;
$tts->Speak(Encode::encode(’shiftjis’, $str));
$tts->WaitUntilDone(-1);
$fs->Close();

読ませたのは『地下生活者の手記』ドストエーフスキイ・米川正夫訳の一節。


「悪人にも、善人にも、卑劣漢にも、正直者にも、英雄にも、虫けらにもなれなかった」


WINDOWSとMacの音声聞き比べ。


「WINDOWS7 SAPI5 Haruka」

「Mac sayコマンド」


WINDOWSもmacも。

OSのデフォルトレベルでここまで聞きとりやすくなってんだなあ。


電子書籍でいうと、これに人名や当て字、ルビを読めれば十分だし、さらに読み上げている箇所のハイライト表示とか、それらの仕込みも実は進んでるんじゃないか。となると、マルチメディアDAISY図書やmedia overlaysによる音声付きEPUB3電子書籍は過渡期の徒花かも。

image

TPP丸呑みで著作権保護期間70年らしい

2015/10/10 [18:11:26] (土) 天気

いままでは50年だったのが、TPP妥結によって70年となるとか。20年延長だ。


著作権の保護期間は何年だったら妥当なのか、という議論はおいとく。

これまで50年でやってきたのに、20年延長ってなんじゃそりゃということ。ルールを変えることになるのに、その根拠はなんなのか釈然としない・説明はあったんかよ、と。


わたしは著作権問題に関して、殊更、高い意識を持ってるわけでもないし、実害を被るわけでもないので、他人事だろうと言われればそれまでなんだけど。


青空文庫の2015年10月07日「TPP大筋合意との報に際して」

http://www.aozora.gr.jp/soramoyou/soramoyouindex.html

の声明文(?)の中でもここ


青空文庫に関わるボランティアは、その多くが作家や作品のファンであり、また少なからぬメンバーが、自分たちの好きな本がいつまでも読み継がれ、世界じゅうで自由に分かち合われ、これから先も公有財産として大切にされてゆくことを強く願うだけでなく、共有された知や文化が社会に循環され、次の新しい創作物が生まれて未来の文化が育まれてゆくことを心から祈って、日々の作業に取り組んでおります。

を読むと、やはりなんの理由・どんな根拠で20年延長、70年となったのか、理不尽、と思ってしまう。


ひとさまの商売の邪魔をしようとか、利益を損うとかいうような話でなくて、「好きな小説」「好きな作家」を読めない状況だけど、なんとかみんなにも読んでもほしいんだよお、というところ。

「うえええ、これスゲー面白いじゃん」「うわ。やべ、泣けた」とか本を読んでどこか動かされたら、ひとに勧めたくなるのが人情、本読みの原点ってもんだろう。ボランティアとして関わるかたの動機は理解できるし、それが作品を世間に広めていくエンジンとなってるはず。


50年が70年になるだけっちゃだけなんだけど20年ってひと一人が成人する時間で、わたしなどはたぶんあと20年たったら、向こう・彼岸に行ってる時間だ。このルール変更はずいぶん乱暴すぎやしないか。



ちなみに、今すでに公開されているものに関しては。

「著作権が期間満了で消滅した後に権利が復活することはない」というベルヌ条約の規定を遵守

ということらしいので、そのまま公開するのは大丈夫っぽい。


わたしは青空文庫のボランティアではない、ただの野良IT屋だけど。

中山省三郎訳のツルゲーネフの『猟人日記』を音声付き電子書籍にして、少しずつ公開してたりして、これが70年となると2017年まで保護期間。

また、いま写経中の米川正夫訳のドストエフスキー『地下生活者の手記』も50年ならば、今年の12月で保護期間終了なんだけど、70年となるとさらに20年先。

とりあえず、このふたつに関しては、滑り込みで大丈夫という理解でいいのかな。


「眼聴耳視」音声付き電子書籍公開リストhttp://t2aki.doncha.net/?id=1425130349


だめ!それアウトとか言われても、障害者差別解消法のことなんかがあるんで、電子書籍化しておいてもどこかで役に立ってくれそうなのでめげずに写経&合成音声作業をしておこう(モチベーションだだ下がりだけどなー)



ニュースやブログなど眺めると、結局TPPってあれこれ丸呑みという話で、いよいよニッポンはイレブンと呼ばれる世界かよ、と。


image

セルフバリカン、セルフ坊主

2015/10/6 [14:51:06] (火) 天気

予想以上に禿が進行してることに気づいたんで、坊主頭にすることにした。


以前間違えてセルフバリカンで坊主にしたことがあったので気楽なもんだ。

ただ、やっぱりというか、電車や街中で見かける坊主頭は、首すじの生え際から後頭部はきれいなグラデーション。プロの仕事は違うよなあ、と感心していた。神は細部に宿る、というやつだ。

全部3mmぐらいなら均一でいいんだろうけど、さすがにそこまでのスキンヘッドもどきは、もっと禿げてからにしようかと思う。


てことで。

基本12mmで、耳の上あたりの側頭部から後頭部は9mm、刈り上げは6mm。という丁寧な仕事を目指してみた。


image

マダラというかマバラというか。どこにもグラデーションなんて見当らないのは素人芸の限界だなあ。


頭寒足熱とはいえ、冬場に坊主頭は寒さ直撃だということを忘れてた。

Ingress Lv15になった

2015/10/3 [19:10:56] (土) 天気

7月3日にlv14になって、先月9月18日にlv15となった。


メダルは揃ってたんでlv14からはただただAP稼ぎ。敵陣営のリンクが集中してるポータルを見つけたら焼き、自陣営のポータルを強化しつつ、CFを狙ってリンクを張る、というIngressの基本に立ち返ったプレイスタイル。


アクションしてればもろもろメダルの実績に繋がるので、銀が金に、金がプラチナにステップアップしていく…のが、とりあえずの面白みといったところ。うーん、ビミョー。


予定通り(?)Rechargerがオニキスとなり、lv16へ必要なメダルはあとオニキス1つとなった。これまた予定通り、そのうちTranslatorかTrekkerでオニキスが取れそうなのでメダルについてはじたばたする必要はない。


この先AP稼ぎとなる。

lv16は4000万AP必要。こりゃ先が長い(現状約2500万AP)

さすがに、ちょっと飽きてきた、かも。


image

オニキス

Recharger 遠隔で見方ポータルの回復

プラチナ

Sojourner 24時間単位でハックし続けた日数

Translator グリフハック成功ポイント

Trekker 歩いた距離

Builder デプロイ数

Connector リンクを張った回数

Engineer 自陣ポータルへのmod差し回数

Explorer ユニークポータルのハック数

Guardian 自ポータルの維持日数

Illuminator CF作成時のmu獲得数

Liberator ポータルのキャプチャ数

Mind Controller CF作成数

Pioneer 初めてキャプチャしたポータル数

Hacker ハック回数

Purifier 敵のレゾネーター破壊数

SpecOps クリアミッション数


前回よりステップアップしたのは

Recharger。金からオニキスへ昇格。

Engineer、Illuminator、Liberatorの3つ。各々、銀から金へ昇格。

一発芸:縦書き段組レイアウトのためにテキストを分割

2015/9/26 [15:38:08] (土) 天気

Firefox41がようやく縦書きに対応したのでこれからは遠慮なく縦書きを使える、すばらしい、というネタの続き。

WEBブラウザでの縦書き表示のあるべき姿について。いや、横書きでいいというひとにとっては意味のないネタ。



縦書きの場合、テキストをそのままブロック要素に流し込むとスクロールとなる。

image

これはありえない。

・文字が切れるのをコントロールできない。

・ページは縦にスクロールして見てるのに、なんでここだけ横スクロール。


ということで、前回も書いたように、縦書きでは段組でレイアウトされるのが正しい。

image

(※どうやら今日時点、Firefoxは縦中横が効かないので「!?」がひっくり返っているけど、ChromeやSafari、IEは問題なし)


で、これがちょっと面倒くさい。

1段落に入る字数と行数によって、どこで次の段落に移動するのかを確認する必要がある。これはやっぱ面倒くさい。

スクリーンショットでいうと「家屋が」で段落が終了して、次の段落が「かしぐ」から始まるというのを判断して段落を分けなきゃいけない。


なもんで、字数行数改行をチェックして文字数を数えて段落単位でテキストを分割するスクリプトを書いた。


[10/02 11:22:44]追記

CSS3のmulti columnを使えばそのまま文字通り段組が実現できる。N字xN行ではなくて、画面幅やテキスト量で柔軟に表示してくれるので、webは本来このCSS3のマルチカラムを使うべき。

版面というかN字xN行のレイアウト表示で見せたい場合にこのスクリプトの出番(css3の完全リフローとは少し違って、N字xN行の箱に入る分のテキストの塊を作るイメージ)



ルビや縦中横に関しては、テキストにHTMLでタグづけされてれば生かす。

でも、わたしは素人のヘタレなので制約はあって。文字数を数えるために。

縦中横の指定のない半角の数字と、半角のアルファベットや記号類は全角に変換。

また、なんちゃって禁則でバグくさいところがある。



https://t2aki.doncha.net/tmp/dangumi-sample.pl

(例によってここは直リンクできないのでこちらからどうぞ)

↑ここでテキストや字詰め行数を入力すると、縦書き段組表示用に分割されたテキスト(縦書き用のスタイルシート付き)のHTMLが手に入ります。


テキトーにテキストを放り込んで試してみてください(わたしはこれで表示の調整をしてました)


縦(字詰め)、横(行数)を確認して縦書きサンプルとして、ブログなどにコピペしてご利用いただければ。


『創作文芸見本誌会場HappyReading』に登録した立ち読み用のテキストなど、ご自分のサイト、ブログで縦書き表示して読者さんに希求できると思います。

(※HTMLが編集登録できるブログ限定でしょうか)


小説は縦で読んでもらおうず!

<<2026/2>>
       
1234567
891011121314
15161718192021
22232425262728
検索:

【最近の20件】