音声合成ソフト

今日時点、5分ほどグーグルで検索してみた音声合成のためのソフト。
ここんとこ、音声つきの電子書籍という話題が増えたような気がしていて、野次馬根性でごそごそと。
HOYAサービス株式会社
VoiceText
株式会社日立ソリューションズ・クリエイト
ボイスソムリエ ネオ
http://www.hitachi-solutions-business.co.jp/products/package/sound/voice/
株式会社エーアイ
AITalk
この3つの中では、ボイスソムリエネオがEPUB3の読み込みと書き出しに現時点で対応している。VoiceTextやAITalkは音声データをwav出力するけど、SMILファイルまでは作ってくれない(EPUB未対応)っぽい。
(DAISY図書を作成するWEBサービスで将来的にEPUB対応というのがあったけど、会員限定で会員資格がちょっと大変なのでスルー)
2014/11/11の記事
障害者差別解消法と公共図書館――電子図書館サービスへの期待とは
http://ebook.itmedia.co.jp/ebook/articles/1411/11/news085.html
にもあるように、2016年4月に施行されることが決った「障害者差別解消法」http://www8.cao.go.jp/shougai/suishin/sabekai.html を睨んで各社参入しようと力が入ってきたのかな。
音声合成ソフトの用途としては各社の導入事例にあるように、バス停や役所の広報誌など広く使える・使われるもので、電子書籍はこれからどうすんだろう、というところか。
前にも書いたように、EPUB3のmedia overlaysで音の編集校正までした品質のものを提供するのと、ユーザー補助やスクリーンリーダーで「今スグ」読むものとの棲み分けがされていくように見える。
ただ、media overlaysのコンテンツが増えるためには、ストアのリーダー・端末が対応(=商売になる)するのが最低条件だろう。kindle koboに頑張ってもらいたい。ただこれは時間の問題かな。楽観。
ざらっと眺めていてちょっと吃驚した。ボイスソムリエネオにはInDesignのプラグイン版があって、校正に使うことを想定していた。スゲー。
http://www.hitachi-solutions-business.co.jp/products/package/sound/indesign/index.html

コミティアで電子書籍(クロヒス諸房さん)


クロヒス諸房のトオノキョウジさんが面白い試み。
本を買ったら「その場で」電子書籍版もプレゼント!
以前、文学フリマがPiOの頃、電書部が電子書籍の対面販売をしていたことがあった。この時は見本を見て購入するには電書部のひとが用意したノートパソコンにメールアドレスを入力。そのメールアドレス宛にEPUB、PDFが送付される、というもの。その電書にはソーシャルDRMとして購入したひとの(わたしの)メールアドレスが埋めこまれていた。
今回のクロヒス諸房さんの電子書籍=EPUB3ファイルは、iOS限定だけどAirDropを使って「その場」で「スグ」に受け渡し。EPUB3ファイルは素の状態でメールアドレスが埋め込んであったり、連番IDが振ってたりということはない。
「こんなの書いてるのは自分だけですから、コピーされても(流出しても)すぐわかりますし(笑)」とキョウジさん。
https://twitter.com/kyozy_tohno/status/561460140704952320
近いうちにご本人が今日のレポートを上げると思うので、受け取った人数や電書の感触なんかはクロヒス諸房さんの公式サイトを観測してください。
「クロヒス諸房.net」http://crohysshobou.net
twitter @kyozy_tohno
ウチの本棚、というか買った同人誌で物理的に崩壊していて、押入とか机の下とか、え?こんなとこに置いてたっけと、もはや収拾がつかない状況。
電子書籍版があるとすごくありがたい。
今日いただいたトオノキョウジさんの『スティーリー・ワンダー』紙本も同人誌袋の中だった。
それを今日、電子書籍版をいただいて、Himawari ReaderというAndroidの電子書籍リーダーに入れて読みはじめて一気に読んでしまった。
かついだピアノを武器に戦う男の話。
いやもう、ハイテンションライトノベル、なのに、描写細部のいちいちがきちんと等身大。ブッ飛んだことを当然とするのではなく、それを見たキャラがきちんとビックリしたり呆れたりするところが感情移入を誘うんだよなあ。
傑作でありました。
クロヒス諸房トオノキョウジさんの作品はアマゾンで紙本や電子書籍、BOOTHやYahooショッピングでも買えるのでぜひぜひ。
http://crohysshobou.net/?page_id=24
「紙か電子か」なんてことを言ってないで「紙も電子も」です。
ちなみにウチは。
ティアズマガジンのプッシュ&レビューに『夏煉喧騒曲』が取り上げられてたりお誕生日席だったりでそれなりの動きだった、のかな。いつものまったりした(年末のコミケのすぐ後なので)ティアと違ってなぜか人通りの絶えないコミティアでした。
わたしは、昨日ちょっと飲みすぎて(いい歳こいて)朝っぱらからゲロるテイタラクなもんで、午後から合流&参加。な状態だったけど、やっぱ楽しい一日だったなあ。
素人によるSQLパズルゲーム

ここにあるのは素人芸なのできちんと調べるなら
「図でイメージするOracle DatabaseのSQL全集」
http://www.oracle.com/technetwork/jp/articles/otnj-sql-image1-308625-ja.html
をオススメ。
以下は、このORACLEのページを元ネタにして雑記帖のカテゴリをいじくった時のメモ。
(具体的にデータベースの構造を晒すのはセキュリティ的に問題があるような気がするので端折った)
「カテゴリを元に雑記帖の記事をリストアップしたい」
・雑記単位で一意のIDがある
・雑記に紐付くカテゴリがゼロ以上複数個ある
| 雑記ID | 本文など雑記内容詳細 |
という雑記帖詳細テーブル
| カテゴリID | カテゴリ内容詳細 |
というカテゴリ詳細テーブル
このふたつを繋ぐために
| 雑記ID | カテゴリID |
という雑記とカテゴリを紐付けるテーブルがある。各々のIDから詳細テーブルがわかるので内容を引っ張りだせる。
「電子書籍」というカテゴリがついた雑記を引っ張りだすには、雑記IDで雑記カテゴリを繋ぐ。inner join、内部結合というやつ。
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID=電子書籍ID
でシンプルにあっさり。
複数のカテゴリから雑記を引っ張りだすのが少し面倒くさい。
その1 和集合

A「電子書籍」か、B「kindle」のどちらかのカテゴリのついた雑記を引っ張りだすには
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID in (電子書籍ID,kindleID)
これでカテゴリに「電子書籍」か「kindle」がついた雑記を引っ張りだせるけど、両方ともついた雑記が2回出てくる。
| 雑記1 | 電子書籍 |
| 雑記2 | kindle |
| 雑記3 | 電子書籍 |
| 雑記3 | kindle |
雑記3のケース。
IDが重複していると、同じ雑記を表示することになってしまうので、重複IDをひとつにするために distinct を使う。
select distinct(雑記ID) from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID in (電子書籍ID,kindleID)
その2 積集合

A「電子書籍」とB「kindle」、両方のカテゴリがついた雑記を引っ張りだすには intersect を使ってふたつの検索結果であるテーブルの積集合をとることになるらしい。
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID=電子書籍ID
intersect
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID=kindleID
1行目のselect文で電子書籍IDのついた雑記を引っ張りだし、3行目のselect文でkindleIDのついた雑記を引っ張りだす。
intersect が、ふたつから共通する雑記IDだけを引っ張りだしている。
この引っ張りだした結果を select で括って条件でフィルタしたり順番に並べたりする。
select * from (
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID=電子書籍ID
intersect
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID=kindleID
)
where文 order by 並び順 limit 個数 offset どこから
積集合じゃないけど、両方のカテゴリがついた雑記を引っ張りだすもうひとつのやり方。
ひとつの雑記に「電子書籍」「電子書籍」などとカテゴリは重複しない。ということを前提にすると。
select 雑記ID from 雑記帖詳細 inner join 雑記カテゴリ ON 雑記ID=雑記カテゴリの雑記ID AND 雑記カテゴリのカテゴリID in (電子書籍ID,kindleID)
group by 雑記ID having count(雑記ID) = 2
というのもありかも知れない。
・カテゴリに「電子書籍」か「kindle」がついた雑記を引っ張りだす
・雑記IDごとにグループ化=集計する
・集計結果が「2」であればカテゴリがふたつともある
最初はこっちで実装してみた。
intersectを使ってtableをふたつ結合するのは処理が重い=遅いんじゃないかと思ったんだけど、計測してみたら全然差がなかった…たかだか(現状)2700程度の数だし。
それなら、カテゴリの重複はない、などと前提条件がつくよりは素直にテーブルを結合させた方が安心安全、かな。
http://t2aki.doncha.net/index.pl?cat=5%2C43
↑カテゴリをコンマで繋いで複数カテゴリのリストアップ。
これは「日野裕太郎」と「doncha.net」の組み合わせ。
日野裕太郎は紙本(商業・同人)があるし、ウチ以外からの電子書籍もあるので細かいコンロールをしたかったんだよなあ。
いろんな場面でカテゴリの組合せが使えるのがスゲーありがたい(自画自賛芸)
perl にしろ SQL にしろ、ネットの情報・紙の解説本が豊富なので、わたしのような素人なら素人なりにレベルに応じて使えるので本当に助かります。
Kindle KDPでTINはもう不要

昨日twitterで見たんだけど。
現在jpとmxとauとcaとinについては米国の30%源泉徴収を適用していないとのこと
そういえば、以前、KDPの管理ページで販売地域の選択がなかったような記憶。iTunesでは地域選択があって、価格を決めるので、KDPは価格設定が販売地域も決めるのか、と思った。今月、久しぶりに登録してみたら、販売地域の選択があったんでいつからあったっけ、と。
販売地域がjpだけの場合にはTINは不要になるのかも知れない。
元ネタはフォローしている漫画家さん・粟岳高弘(@AwatakeTakahiro)さんの一連のツイート
https://twitter.com/AwatakeTakahiro/status/561067604043767808
https://twitter.com/AwatakeTakahiro/status/561069629330567169
これが事実として公式に確認できたらビッグニュース(ご当人ももっと話題になってもいいのに、と)
個人がKDPに参入するのに一番のネックになってるのがこの税金処理。
電子書籍を作る環境は出揃っているので、このうっとーしー税金処理さえなくなれば参入する個人作家が増える・コンテンツが増えるのは間違いない。
「Kindleの電子書籍に消費税適用へ 2015年度から Googleの広告にも」
http://www.huffingtonpost.jp/2014/06/25/kindle-consumption-tax_n_5531962.html
あたりが関係してんのかな。
[2015/02/17 08:55:12]追記。
Amazon Kindle公式のヘルプ「米国以外の出版者の源泉徴収税」に
* 米国以外の Kindle ストアで得たロイヤリティについては、Amazon は米国の源泉徴収税の徴収を行いません。
https://kdp.amazon.co.jp/help?topicId=A1CTSIBPDAAJ0M
と明記されていた。

粟岳高弘(@AwatakeTakahiro)さんのツイート通り、日本で売る限りEINやITINを取得する必要はない、ということだな。
もちろん、米国で売れるとその分に関しては30%天引きされるんだろうけど、日本語で書かれた本が米国で大ヒットするとは思えないので面倒な減免の手続きをすることもない。
上記した電子書籍に消費税適用のほか、日米租税条約の改正が去年暮れだか今年あたりに発効とかも影響があったか。
所得に対する租税に関する二重課税の回避及び脱税の防止のための日本国政府とアメリカ合衆国との間の条約を改正する議定書」
文字通り、二重課税防止のための条約ということなので、遵守しろよ、と厳しくなったんかねえ。
読書・蔵書記録のための本のデータ

「何を今さら」で「大昔からあちらこちらで語られてる」ネタなんだけど、本のデータについて自分備忘録。
図書分類は知らなくても、ECで5年やってたことがあるので、商品のデータ構造やその表示について、という側面から。
本が好きな人は、読書・蔵書記録をつけるのも好きであろうと思う。たとえばWEBサービスを利用したり、パソコンでソフトを使ったり、手書きでノートにつけたり。
本の最低限のデータをエクセルにすると、ありがちなのはたぶんこんな感じ。
| タイトル | 著者名 |
|---|---|
| サイボーグブルース | 平井和正 |
| 復活の日 | 小松左京 |
| 襲撃のメロディ | 山田正紀 |
| おかえりください | 日野裕太郎 |
でも、これはあっと言う間に破綻する。
著者が複数の場合があるし、その人数もわからない。
| タイトル | 著者名1 | 著者名2 | 著者名3 | イラスト |
|---|---|---|---|---|
| サイボーグブルース | 平井和正 | 桑田次郎 | 生頼範義 | |
| 復活の日 | 小松左京 | |||
| 襲撃のメロディ | 山田正紀 | |||
| おかえりください | 日野裕太郎 | おおぬまひろし |
ここにさらにイラストレーターやカメラマンなどの欄が欲しくなるだろうし、自分なりのカテゴリ欄や感想・メモ欄も欲しくなるのが人情というものだ。そのどれもがいくつの欄が必要になるのかわからない。
1タイトルを1行に納めるのは無理だというのがわかると思う。
なもんで、じゃあ「本ってなぁに」ということから始まるんだけど、別にメタな話ではなくて、具体的な話。
とりあえず「本というのはタイトルにいろいろくっついたデータの集り」ということにしておく。
(本に限った話じゃないとか、タイトル改題とかどうすんのとかは無視)
| タイトル | サイボーグブルース |
|---|
| タイトル | サイボーグブルース | いろいろ | 平井和正 | これは何? | 著者名 |
|---|
| タイトル | サイボーグブルース | いろいろ | 桑田次郎 | これは何? | 著者名 |
|---|
| タイトル | サイボーグブルース | いろいろ | 生頼範義 | これは何? | イラスト |
|---|
| タイトル | サイボーグブルース | いろいろ | SF | これは何? | カテゴリ |
|---|
| タイトル | サイボーグブルース | いろいろ | ハードボイルド | これは何? | カテゴリ |
|---|
「サイボーグブルース」というタイトルを持つデータを集めれば「サイボーグブルース」という本ができあがる。著者の人数の制約もなく、イラストの他に「いろいろ」に出版社や定価なんてのを追加するのもスグ。
今度は逆に「いろいろ」の中から「平井和正」を集めれば、「サイボーグブルース」や「死霊狩り」「狼男だよ」などの「タイトル」をリストアップできる。
さらにそのリストアップされた「タイトル」にくっついている「いろいろ」の「カテゴリ」を集計して「平井和正」の傾向を見ることもできる。
…なんだ、リレーショナルデータベースの話かよ、というのはその通りで、本のデータをゴソゴソいじるのにリレーショナルデータベースはちょお便利。ウチのサイトのデータベースはまだあれこれあるんだけど、基本はこの程度。
ただ、気楽に使えるリレーショナルデータベースというのが検索しても見当らなかった。
わたし自身はWEBで定番のデータベースを使ってるけどちょっとハードルが高いかなぁ。パソコンで使えるものとなると、ACCESSやファイルメーカーらしいんだけどお値段がちっとアレ。
エクセルで表にする時、上記したような形式ではなくてこんな感じにするといいかもしれない。
| タイトル | いろいろ | これは何? |
|---|---|---|
| サイボーグブルース | 平井和正 | 著者 |
| サイボーグブルース | 桑田次郎 | 著者 |
| サイボーグブルース | 生頼範義 | イラスト |
…て、SQLの和集合、積集合や内部結合についてメモしようと思ってたのに、なんでこんなこと書いてんだか。SQLパズルについてはまたそのうちメモしよう。

