MacにOpenJTalkをインストール

2016/6/1 [18:17:13] (水) 天気

OpenJTalkというのはフリーの音声合成エンジン…てことでいいのかな。

・名古屋工業大学の研究チームが作っている

・パラメータ次第で音声の感情表現など調整できる

ということをついさっき知ったばかりで、どんなものかMacでビルド&コンパイル、インストールしてみた。


忘れないうちのとりあえずメモ。

インストールしたのはMac OS X El Captain 10.11.5


必要なものは。

https://sourceforge.net/projects/hts-engine/

↑こちらから最新(今日時点)の

・hts_engine_API-1.10.tar.gz(APIライブラリ)


https://sourceforge.net/projects/open-jtalk/

↑こちらから

・open_jtalk-1.09.tar.gz(本体)

・open_jtalk_dic_utf8-1.09.tar.gz(辞書ファイル)


https://sourceforge.net/projects/open-jtalk/files/HTS%20voice/hts_voice_nitech_jp_atr503_m001-1.05/

↑こちらから最新(今日時点)の音響ファイル

・hts_voice_nitech_jp_atr503_m001-1.05.tar.gz


以上4つのファイルをダウンロード。


1)

OpenJTalkをインストールする適当なフォルダを作る

/usr/local/OpenJTalk


2)

まずAPIのビルド&コンパイル

./configure --prefix=/usr/local/OpenJTalk

make && make install

プレフィックスは最初に作ったフォルダpath

この時、エラーが出るけど気にしなくても大丈夫っぽい。


3)

Open JTalkのコンパイル前に

http://www.techscore.com/blog/2015/06/29/open-jtalk-japanese-text/

を参考に、jpcommon/jpcommon_label.cにパッチを適用する。


284行目あたり
if( index== a)
  break;
}
+if( i > 3 ) i = 3;

384行目あたり
for(i=0, index=m->next; index != NULL; index = index->next)
  i++
+if( i > 10 ) i = 10;


4)

Open JTalkのビルド&コンパイル

 ./configure
 --prefix=/usr/local/OpenJTalk
 --with-hts-engine-header-path=/usr/local/OpenJTalk/include
 --with-hts-engine-library-path=/usr/local/OpenJTalk/lib

make && make install

プレフィックスは最初に作ったフォルダpath

ヘッダーとライブラリのpathを指定(※API作成時にインストールされている)

(--with-charset=UTF-8 が必要という記事もあったけど、このバージョンだとなくてもUTF8の日本語を読みあげてくれる)


5)

辞書ファイル

open_jtalk_dic_utf8-1.09.tar.gz

↑を解凍して*.binと*.dicを/usr/local/OpenJTalk/dic/にコピーする


音響モデルファイル

/usr/local/OpenJTalk/フォルダにvoice/(名前はなんでも)というフォルダを作って

hts_voice_nitech_jp_atr503_m001-1.05.tar.gz

↑を解凍してフォルダごとコピーする


0)

その他の音声ファイルとしては

MMDAgent_Example-1.6.zip

の中にあるmeiという女性の声も使える。



テキストファイルを読み込ませて音声ファイルを作る

./open_jtalk
 -x /usr/local/OpenJTalk/dic
 -m /usr/local/OpenJTalk/voice/hts_voice_nitech_jp_atr503_m001/nitech_jp_atr503_m001.htsvoice
 -ow test.wav
 sample.txt

x は辞書のフォルダ

m は音響モデルファイル

ow はアウトプットwavファイル test.wav


ひとつ利点があるとすると、電子書籍にすれば音声を付けられる。視覚に障害のある子やディスクレイシアの子にとって有用…でも、スクリーンリーダーもあって、そこに読み上げ部分をハイライトさせる機能をつけるのと、音声つき電子書籍の普及とどっちがどっちなんだろか。技術的なことはわたしは素人なのでわからない。

こんなテキストを読みこませたんだけど、読み間違いがひとつもなくて吃驚した。イントネーションや区切りかたもいいなあ。


にしても、こういうのがフリーで(BSDライセンス)で作られてるんだなあ。

かたや、日立や東芝といった私企業が研究開発費をかけて作ってる音声合成エンジンあって、実用・利用されつつある。


障害者差別解消法が施行されたこともあって、音声サービスの需要が高まってるところだろう。

今年はこのあたりの動向が面白いかも。


image


障害者差別解消法うんぬんということだけではなくて、ページをめくる手がない・文字を目で追えない子育てママ・パパさんやドライバーのかたにとっても音声での読書サービスは有用だしねえ。

<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】