電子図書館サービス

いや、わたしの観測範囲だけど。
電子書籍を図書館に導入という話題がぼろぼろ流れてきている。
ひらたくいうと、図書館で電子書籍もかりられるようにしよう、ということ。
出版社、権利者にしてみれば、街の本屋だろうが図書館だろうが似たような蛇口のひとつだろう。粛々と図書館に向けての権利処理や利用方法・範囲のガイドラインなんかを詰めていけばいいだけのことだと思う。
(図書館に本の売上が食われて困るとかいう話もあったけど、図書館や学校が買い支えになって存続できる本もあるはずだから…なんとも)
以下のふたつのレポートとニュースがわかりやすい。
『KADOKAWA、講談社、紀伊國屋書店が設立した日本電子図書館サービスのビジネスモデル ── JEPAセミナーレポート』
http://www.wildhawkfield.com/2015/03/JEPA-seminar-JDLS-LibrariE.html
『楽天、米Overdriveの買収発表――電子図書館事業にも参入』
http://ebook.itmedia.co.jp/ebook/articles/1503/19/news123.html
(あれ? そういやこの楽天が買収したOverdriveってメディアドゥが業務提携したとかの話はどうなったんだっけ http://www.mediado.jp/corporate/1040/)
そこでちょっと野次馬根性だったりするんだけど、やっぱここなのかなあと、過去雑記の焼き直し。
鷹野凌(@ryou_takano )さんのJEPAセミナーレポート
音声読み上げは?
TTS(合成音声)。読み上げ速度を可変できるようにしている。人が読み上げたオーディオブックも取り扱っていきたい。読み上げできない本もある(著作権者の許諾が必要)。
2014/11/11のレポート
『障害者差別解消法と公共図書館――電子図書館サービスへの期待とは』
http://ebook.itmedia.co.jp/ebook/articles/1411/11/news085.html
障害者差別解消法が施行されると、すべての公共図書館は障害のある人たちに対して合理的配慮が義務付けられる。点字図書や対面朗読といった従来の方法では、人員の面からも利用者の要求に応えることは難しくなるだろう。そこで注目されているものの1つが電子図書館サービスだ。
※内閣府「障害を理由とする差別の解消の推進」
http://www8.cao.go.jp/shougai/suishin/sabekai.html
法律の施行が平成28年4月1日てことは予算がつくのは今年の夏ぐらいか。
・法律で義務づけられる(罰則が入ると実効性が現実味を帯びるなあ)
・予算がつく(金が動くと普及に拍車がかかるよなあ)
電子書籍が対象の法律、というわけではないにしても、こんな具合に「図書館」+「電子書籍」の話題で盛りあがるのは電子書籍に追い風なことも確かだろう。
実際、電子書籍は「フォントの大きさが変えられる/画面のコントラストを変えらえる/音声を付けられる」とアクセシビリティということでいえば、この法律の要件を満たしているかも。
とはいえ、図書館に関しては。
「近畿視情協主催「どうなる! 電子書籍のアクセシビリティ ~ だれにも使える「本」の実現をめざして」#近畿視情協」
という、まとめ記事の中に
しかし、公共図書館で電子書籍の話をするとデジタルバイドではないか、高齢者は紙の書籍を好むと言われて、意外と否定的な意見が多い。#近畿視情協201519
という意見もあって、たぶんこれが現場の現実感だと思うんで、なかなか簡単ではないような気もするし。
てことで、たまたま昨日、地元図書館で次の写経本を借りてきたのでありました。
全集や叢書の品揃え(?)は、図書館が強いなあ。

音声合成聞き比べ

ちょっと検索するだけでもいろいろ出てくる合成音声ソフト。
有料のものは、現時点では、なかなか個人が趣味で気軽に手を出せる金額ではなさそう(だいたいどこも50万円あたりという噂)なんだけど、どんなものかちょっと聞くだけは聞ける。すっぱい葡萄。
どれもWEBで体験・お試しページがあって、とりあえず青空文庫『ドグラマグラ』の冒頭を読み上げてもらったのが以下。
…………ブウウ――――――ンンン――――――ンンンン………………。
私がウスウスと眼を覚ました時、こうした蜜蜂の唸るような音は、まだ、その弾力の深い余韻を、私の耳の穴の中にハッキリと引き残していた。
AITalk
VOICETEXT
ボイスソムリエネオ
http://www.hitachi-solutions-business.co.jp/products/package/sound/voice/
アクセントもイントネーションも、これなら十分すぎるぐらいイケてる。こんなに聞きとりやすいんだと、どれにもちょっと吃驚。ほとんど違和感がない。
(ボイスソムリエネオは辞書?日本語解析?が弱いっぽく、読み間違いがあるけど)
さすが、金・人・時間をかっちりかけて企業が開発しただけのことはあるなあ。研究開発費が回収できたら、一般向けに廉価版を販売してくれないかしらん…。
以下のふたつはフリーの音声合成。
(macのVoiceOverのシステム音声は「フリー」じゃないけど「無料」という意味の方で)
macのVoiceOver
Windowsで棒読みちゃん
http://chi.usamimi.info/Program/Application/BouyomiChan/
アクセントもイントネーションも違和感がある。
上記の商用アプリと比較すると「機械やなあ」
でも、実のところ、わたしはこれはこれでOKだと思っている。
たぶん、アニメや特撮を見て育ったこともあるんだろう。ロボット、機械がしゃべるシーンをたくさん見てきた。「未来」はこんな感じだったよなあ。
音声の校正修正

電子書籍につける音声の調整については先日雑記に書いたとおり。
正解が分からないのでキリがない、というところ。ていうか、正解はあるんだろうか。
日本語の文法や言葉づかいとはまた別の「音」の世界。
鼻濁音とか無声音とかそこには別の概念があるようで知的好奇心(とかいうとカッコつけてるけどひらたく「野次馬根性」)を刺激される。
ひとつのコンテンツがいくつものレイヤーでその各々のメソッドで解釈されうるてことだよねえ(胡散臭いカタカナがみっつもあるのは勘弁してください)
読み上げ音声に関して、NHKの訓練されたアナウンサーでも「これでOK」とは言えないような気がする。実際にどのようなスタッフで共有して作成しているのか知らないけど、朗読会やDAISY図書は「正しい」音声をどういう扱いでやってるんだろう(興味津々)
今日、公開した音声付き電子書籍「苺の泉」(『猟人日記』ツルゲーネフ)
http://t2aki.doncha.net/?id=1425130349
は、句読点でバラしたフレーズが765個。今回はあきらかな読み間違いだけではなく、ちょっと頑張って765個の音声を聞いてイントネーションの調整もやってみた。
最低一回は聞く。読み上げる時間がそのまま最低限必要な時間で、読み間違いがあったら修正してそれを再生して確認する。イントネーションの調整もはいると、そのつど、修正+再生確認となる。
週末の一日をほぼこれで潰すこととなった(にもかかわらず、誤植誤読はあると思う)
でも、そもそも、その修正は正しいの?
…という疑問・疑惑が抜けきれない世界だ。
こいつを作業フローとして眺めると。
単純な「作業」にはならない。複数のスタッフで分担できるんだろうか。チェックボックスにチェックして次に回す、てな仕事にはならない。
めちゃくちゃ属人的(ひと頼み)の仕事にみえる。
音声合成、人工音声を使えば、従来の朗読音声を組み込むのと比べると格段に早いというのは分かるけど、それでもそんなに簡単なものじゃないなあ、というのが、今回ちょっと頑張って作ってみた実感。
わたしが使ってるのはSofTalk経由でAquestの音声合成エンジン。
SofTalkや棒読みちゃんに使われているし(素人だけど)わたしも納得の音声が得られる。
それなりの音声合成ソフト(ボイスソムリエネオやAITalkなど定評のある音声合成ソフト)を使っても同じこと。結局は微調整がはいる(「微」調整)といったって「やりなおし」には違いない、同じこと。
結局のところ、ひとがその音声を聞いて確認・修正する必要があるんだからね。
決して他人事じゃなくて。
わたしは、あまり目が強くないようで、音声付き電子書籍には期待するところがある。
両目とも歳を食ってから
「網膜血管硬化症」「網脈絡膜萎縮」
といった診断をされていて、さらに片目は盲点があって見えないブラックホールがあるらしい(…とか言われてもよくわからんのだけど)たぶん、緑内障、網膜剥離のリスクをかかえてるんだろう。
先週末あたりから、視界の中、細い白く光るロープが縄跳びをしているのを見るようになったんで、ビビって、今日6年ぶりだかで地元の眼科に行った。
とりあえず、網膜剥離も眼底出血も見られないので、まだ大丈夫らしい。…でもなあ。いつこの目がアウト宣告されるか分かったもんじゃないんで、音声付き電子書籍の普及を願いたい。
何やら事件の痕と茶色の食卓


近所のいつもカモがいる人工の池。
先日行ってみたら、カモの羽が水面に散乱していて驚いた。
犬も猫も多いので何か起こったのかも知れない…梨木香歩の『ピスタチオ』的なことを考察してみようと思ったけど、わたしはただの無職初老、あの発想・描写はとても無理。
ああ、いよいよ食うに困ったらこっそりこいつらを絞めて食材にすることになるんだなぁ、ぐらいの感慨。
ここ最近の自作料理はほとんど茶色。

出汁を取って刻んだ昆布、縮緬ジャコ、沢庵の微塵切りを胡麻油で炒めたもの。
醤油・味醂・鷹の爪・胡椒。
濃いめで白米にピッタリ…これだけでモリモリ2膳は食える。

腿肉からひっぺがした鶏皮を煎餅に。
鶏皮煎餅で出た油で薄切りにした椎茸を炒めたもの。
ニンニク・鷹の爪・塩・胡椒・醤油・マーガリン。
鶏皮煎餅はもちろん、椎茸炒めは当然のようにコクがあってツマミにピッタリだった。

鶏皮と切干し大根をトウチで炒めたもの。
塩・胡椒・鷹の爪。
切干し大根にしっかり味がつくのでトウチの勝利。

ほうれん草としめじをホワイトソースで炒め煮。
ホワイトソースはテキトー目分量。牛乳を入れて小麦粉(薄力粉)を混ぜてトロっとしたらできあがり。
塩・胡椒・コンソメ。
ほうれん草を一束、むしゃむしゃ食って腹いっぱいだった。

トマトとタマネギの炒めもの。
タマネギをコンソメでしっかり炒めて、トマトは余熱で。
塩・胡椒。
トマトは熱を加えると甘味が増す、ような気がする。
電子書籍につける音声の調教

「SofTalk」も「棒読みちゃん」もイントネーションやアクセントの調整ができる。
というか、両ソフトが利用しているAquestの音声ライブラリが音声の調整をしている。Aquest社のサイトに仕様書があって、それを読むと音声の細かい調整が可能で、単純な棒読みではなく、それっぽい読み上げ音声にしあがる。
Aquestの音声記号列仕様書
http://www.a-quest.com/download/manual/siyo_onseikigou.pdf (※PDF)
文章をそのまま読ませてみた。
「私がウスウスと眼を覚ました時、こうしたみつばちのうなるような音は、まだ、その弾力の深い余韻を、私の耳の中にハッキリと引き残していた。」
・「眼」を「がん」と読んでいる
・「こうした」は「こーした」の方が聞きとりやすい
・「時、」「は、」「を、」など読点直前の音が上がってしまっている。
音声記号でアクセントや区切りを指定した。
「私が,ウスウスと/めを覚ましたと’き,こーしたみつばちのうなるような音’わ,ま’だ,その弾力の深い余韻を、私の耳の穴の中にハッキリと引き残していた。」
これは、それっぽく聞きとれる。
語尾上がりになっていたところ(「とき」の「と」など)にアクセントを入れただけでずいぶん聞き取りやすくなった。
アクセントとポーズを調整するだけでかなり音声のクオリティは上がる。
なんでこんなこと調べたかというと。
今、スクリプトで作った音声付き電子書籍は句読点単位でバラして音声を作っている。
もしかして、センテンス(もっと長文)ごとで音声を付けた方が、SofTalkや棒読みちゃんがそれっぽく音声記号をつけてAquestのライブラリに渡してくれて自然な読みになるのでは、と。
でもやっぱり、それなりの調教は必要だなあ。ラクな道はないようで…。
ちなみに句読点単位でバラした方がそれっぽい、かも。
読点直前の語尾上がりがおさまっている…て、バラす時に読点を削除してるのでその副作用だけどね。

