書誌情報データを求めて三千里

一昨日、新元号の発表があった4月1日に国立国会図書館の書誌データAPIが解禁となった。
今までも検索などに使えていたけど、データベースとしてガツガツ使うには登録が必要だったり面倒くさかったのが、4月1日からは誰でも自由に使ってもかまわんぜ!になった。
てことで、今さら国立国会図書館の書誌データAPIをごそごそ覗いてみた。
国立国会図書館サーチについて>API仕様の概要
https://iss.ndl.go.jp/information/api/riyou/
わたしの、というかわたしが公開しているサイトの使い方は前にも書いた通り。
「ISBNをキーにして書誌データと書影URLを取得したい」
たとえば、スティーヴン・キングの『シャイニング』
ISBNは978-4167705633
これを国立国会図書館のAPIで探すには以下
https://iss.ndl.go.jp/api/opensearch?isbn=978-4167705633
→書誌情報のXMLが返ってくる
https://iss.ndl.go.jp/api/openurl?isbn=978-4167705633
→検索結果ページが返ってくる
https://iss.ndl.go.jp/api/sru?operation=searchRetrieve&maximumRecords=10&query=isbn%3d9784167705633
→書誌情報XMLが返ってくる(このsruはさらに細かく検索方法の指定もできる)
うちの場合、必要な書誌情報はopensearchで十分。
著者についてももろもろ考慮されて(同性同名や読みなど)おり、データのクオリティは信用できる。さすが。
https://www.ndl.go.jp/jp/data/faq/author.html
蔵書のある図書館の情報なども取得できるので、位置情報と合わせて「目当ての本がある最寄りの図書館」なんて検索も実装できるし、その手のアプリがすでにあるのは、国会図書館のデータが元ネタじゃないかな。
だけど、書影がないのはほんと残念。
本棚を眺める楽しみのひとつ、というか欠かせないのが表紙だもんなあ。
基本的な書誌情報は国立国会図書館で、書影・表示画像はamazonなどのショップサイトのURLを別途取得…とか1冊の本のために2回も外部にリクエストしてるとサイトの表示がもたつく原因になってしまう。
てことで、うちのサイトのデータ取得方法は現状のままとする。
国会図書館のデータはまた何か別の用途で利用させてもらおう。しっかりとしたデータは見ていて気持ちいい(データオタク)
ちなみに。
「一般社団法人 日本出版インフラセンター」という版元主導のところも3月25日に書誌データベースのサイトをオープンしたけど、APIもなく、手入力でポチポチ検索できるだけ、なのでスルー。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
Amazon Product Advertising API利用制限

AmazonのAPIが2019年からポリシー変更となった。
ひらたく言うと「売上のないサイトやアカウントはAPIを利用できなくなる」
さらにひらたく言うと、わたしのアカウントは売り上げがないので利用できなくなった。
Product Advertising API (PA-API) の利用ガイドライン
https://affiliate.amazon.co.jp/help/topic/t32/
[重要] Product Advertising API 利用ポリシーの変更について
https://affiliate.amazon.co.jp/help/topic/t52/
Amazonの商品データベースを利用できるAPIはかなり便利で、また使い勝手もよかったので残念。
もちろんアフィリエイトで小遣い稼ぎになるならありがたい話だけど、うちのような辺境にそれは見込めないので、もともと「充実した本のデータベース」として重宝していた。
ISBNさえあれば、ほとんどの本の情報が揃ってるから。
わたしが利用しているのは
・書名
・著者(作者、翻訳者、挿絵など)
・書影
の3点。価格については変動してるのでおまけ程度。
なので、その3点に絞ってamazonのサイトをクロールして情報を取得するように順次変更する。
とりあえず、まずはお問い合わせ(本が登録できんぞ!)をいただいている
「趣味は読書2」https://doncha.net/
をあわてて修正。
これはWEB本棚で、本が登録できないなど論外だ。
amazonの検索結果からも登録できるようにしてあったんだけど、これはちょっと無理。サービスレベルが落ちるがしかたなく諦め。
また、やはりサイトをクロールするより、APIの方がレスポンスが断然早いなあ。クロールだとひと呼吸待つ感じになってしまった。
わたしが公開しているサイトのほとんどはamazonを利用しているので全部の修正は時間がかかりそうだ。とほほ。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
松も取れたところで今年の目標

ここ10年で、本を一番たくさん読んでたのが2006年の143冊、全然読んでないのが2014年の7冊(再読本、同人誌、コミック除く)
見ると2012年以降の4年は激減。2011年以前は片道約40分の始発→終点、往復約80分の通勤で、本を読む空間と時間がたっぷりあった。
現状は在宅IT軽作業だったり、出先に行くにも15分程度の乗り換え3度だったりして、本を読むのにまとまった時間がなかなか取れない。いや、気持ちに余裕がないのも原因のひとつだけど。
改めて「趣味は読書」http://doncha.net/の自分の本棚を眺めて愕然というか呆れた。
いくらなんでも年間一桁しか読んでないなど論外だ。
てことで、今年、2016年は本を読むことにした。
「おいおい、何いうてんねん、その前にやることあるやろ、稼がんといかんのと違うか。びっくりやで」
と叱責されてもしょうがないビンボ初老フリーターだけど、金がかかるのは健康面ぐらいなもので、贅沢な支出はない、はず。
情報収集するわけでもなく、ただ呆けたようにネットを眺めてるひまがあったら本を読もう。
んで、この正月、だらだら酒を飲みながらkindleで読むのが快適だった(再三再四の今さら感)
基本的にPaperwhite(2012)で読んでいるけど、スマホのアプリでも読めるので、本を持ち忘れることがない。
物理的な厚みがなく、どんな長編でも同じサイズなので鞄の中に、一定のスペースがあればいいし、寝転がって読むにも重さが変わらない。
本棚ごと持ち歩いてるようなもんだから、読み終わっても次がすぐに読み始められる。
もう先の方が短い歳なんだから、少なくとも年間二桁冊数。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
WEB本棚「趣味は読書2」の集計データ

WEB本棚「趣味は読書2」
http://doncha.net/
というサイトを制作して公開している。
2006年4月1日、自宅のサーバーで公開開始。震災の影響(停電)で自宅サーバーを諦めてレンタルサーバーに引越したりしたけど、そろそろ10年近く続けていることになる。ここ数年はほとんどメンテしてなくてスマホにもまともに対応していない古くさい造りのまま。それでもわたし自身はけっこう重宝してるし、アクティブな参加者さんもいて、本棚を作る・眺めるのは楽しいものだ。
てことで、またちょっと「趣味は読書2」のデータ集計。
(前回5月→http://t2aki.doncha.net/?id=1431564639)
現状(11/6日現在)
登録会員数:330人。登録タイトル数:40326。登録著者数:14452人
人気タイトルは『空の中』『太陽の塔 』『陽気なギャングが地球を回す』『 重力ピエロ』『予知夢』『しゃばけ』など。
人気の著者(著者だけじゃなく翻訳者もカウント)は恩田陸、東野圭伍、茅田砂胡、小野不由美、宮部みゆき、栗本薫、伊坂幸太郎、田中芳樹、有川浩、スティーヴンキングなど。
浅倉久志、大森望がベスト30に入ってるのは翻訳物も読まれている(登録されている)ということ。
詳細はこちら→http://doncha.net/about.pl?c=report_bolivia
(毎月1日更新するように仕込んだ)
いわゆるベストセラー作品、ベストセラー作家が順当に上位を占める感じかな。
ただ、上位は集計上位ということで、うひゃこれ読んでるのか、とニンマリできるのは上位に出てこない隠れたタイトル、作家さん。
本棚はやたら公開するものではないということで、「趣味は読書」はクローズドな作りだけど、ログインすれば他の参加者さんの本棚を眺めることができる。たまにぼーっと眺めて次これ読んでみようと思う本もある。
…てなこと言ってるけど、実際は、アクセスログ解析で見る限り、みなさんほとんど(9割以上)自分の本棚へ直行直帰なので、新しい本との出逢いということでは、残念ながら機能してないかな。
もうひとつ。今回、登録されているタイトルのカテゴリを集計してみた。
「趣味は読書」ではカテゴリは参加各個人が自分でつけることにしたので、たとえばわたしは
こんなカテゴリわけにしたけど、他の参加者さんはまた違っている。
WEB本棚「趣味は読書2」としてのカテゴリ集計はできない。
ので、アマゾンでつけられているカテゴリを使った。
この最初のカテゴリ。
これはカテゴリとして苦しいのでひとつ上のカテゴリ(「日本文学」「直木賞」)を採用。
登録されたタイトルのカテゴリ数:593
【ベスト10】
冊数 | カテゴリ | 10149 | コミック |
---|---|
5556 | 日本文学 |
4310 | 英米文学 |
3574 | ライトノベル |
1944 | ミステリー・サスペンス・ハードボイルド |
1264 | 文学・評論 |
1260 | SF・ホラー・ファンタジー |
753 | 歴史・時代小説 |
514 | エッセー・随筆 |
468 | 近現代の作品 |
(※APIで取りこぼしてるものがあるし、洋書(.com .ukなど)はカウントしていないので数字はざっくり参考値)
アマゾンがつけるカテゴリは「売る側の、売るための」カテゴリわけなので、本を整理整頓・管理するためのカテゴリわけとは種類が違う。
集計に使ったカテゴリ例にあるような「あ行の著者」とか、えーほら、なんやったかな「い」で始まる名前でな、という時には役に立つ、のだろう(さすがにこの手のは集計から外したけども)
それらをごちゃっと一緒くたに集計して、何か意味があるかと言われると、よくわからない。アマゾンのAPIにリクエストするだけで取得できるしとりあえずネタ程度に面白いかも知れない、ぐらいかな。
このベスト10カテゴリ合計は全カテゴリの75%を占める。これが「趣味は読書2」に登録されている本の傾向。
「その他」には、アマゾンの売るための動線確保カテゴリ「霊界・恐怖体験」だの「企業革新」だの「微生物学」だのニッチなもの、というかそれってカテゴリなのかというようなものがぞろぞろと。これはこれで見てると「こーゆーとこからも集客あるのかあ」的に面白いんだけど、わたしの想定するカテゴリとしては雑音・誤差。
また、小説などの場合、ほぼ1タイトル1冊なのに対して、コミックは1タイトルでン十冊なのもあって(こち亀などジャンプ系の人気マンガを全巻登録してらっしゃるかたもいて)同じように集計するとどうしても1位はコミックになる。
アマゾンの大雑把なカテゴリを使ったので当然っちゃ当然の話、街の書店と同じような棚の並びになって意外性に乏しい結果となった…て、意外性を求めてどうする。
まだまだ知らない面白い本はたくさんあるので、こうやって本棚、ずらっと並ぶ本のタイトル・作家さんの名前を眺めると「たくさん読まねば」と焦るなあ。命短し本読め爺ぃ。
[11/10 08:25:49]
もはや古臭いサイトと言いつつ、twitter連携は仕込んでいて、読了/積読のツイートをしたり、ツイートすると本棚を検索して結果をリプライしてくれたり。今の時点でも、まだちょっと便利なところはある、かも。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
読者コミュニティ「趣味は読書2」の登録データ

「趣味は読書」というweb本棚サービスを2006/4/1から公開している。
今日時点
登録会員:310名
登録冊数:49,780冊
登録タイトル:38,851タイトル
登録著者:14,264人
【人気タイトル(会員10人以上が登録)】
17 | 空の中 |
15 | 太陽の塔, 陽気なギャングが地球を回す, 重力ピエロ, 告白, 夜のピクニック |
14 | 予知夢, しゃばけ, 死神の精度, 海の底 |
13 | 西の魔女が死んだ, アヒルと鴨のコインロッカー, 探偵ガリレオ, 夜は短し歩けよ乙女, 博士の愛した数式, 四畳半神話大系, 阪急電車, 華胥の幽夢(ゆめ)—十二国記 |
12 | 魔性の子, 容疑者Xの献身, オーデュボンの祈り, 終末のフール, 火車, ラッシュライフ |
11 | 光の帝国—常野物語, レインツリーの国, クジラの彼, グラスホッパー, 手紙 |
10 | 鴨川ホルモー, 天使, 夏への扉, 図書館戦争, アルジャーノンに花束を, 少女には向かない職業, 村田エフェンディ滞土録, 夏と花火と私の死体, 氷菓, 六番目の小夜子, ハサミ男, ゴールデンスランバー, 向日葵の咲かない夏 |
【人気著者ベスト20(登録された本の総数)】
376 | 恩田陸 |
345 | 東野圭吾 |
340 | 茅田砂胡 |
307 | 小野不由美 |
302 | 栗本薫 |
299 | 宮部みゆき |
229 | 田中芳樹 |
215 | 伊坂幸太郎 |
206 | 有川浩 |
178 | 藤子・F・不二雄 |
168 | 浦沢直樹 |
158 | 浅倉久志 |
157 | 村上春樹 |
156 | 西尾維新 |
153 | 秋本治 |
150 | CLAMP |
150 | 荒川弘 |
146 | 京極夏彦 |
144 | 桜庭一樹 |
142 | 大森望 |
141 | スティーヴンキング |
「趣味は読書2」
http://doncha.net/about.pl
図書館で本を借りて図書カードを見て
「あれ?あのコもこれ読んだのかぁ」とか「おっあいつこんなの読むんだ」と、ニマニマしたり
ひとんちに呼ばれたら、まず本棚を覗いて
「これ、わたしも読んだよ」と言いたくなったり
図書館とか本屋で、どの棚の前に立っているかで、そのひとの属性がわかって、うれしかったり
なんだか「ありきたり」な趣味なので履歴書にも書けない気がしたり
本を読んでも難しいことを考えたり感想文は面倒くさかったり
ヲタクだと思われそうで嫌だったり
でもって、だけど本好きとか本読みですが、なにか?
というようなことを、思ったことはありませんか? ぼくは、あります。なので、そんな本棚のようなサイトを作ってみました。
『読者のコミュニティ』
↑にも書いたけど。
東日本大震災の時、自宅サーバーで公開していたものを一度閉じて、レンタルサーバーで再開。
2006年公開当時、流行りのmixiもどきで掲示板や日記などつけたんだけど、利用パターンの8割以上が「本棚直行直帰」だったのでリニューアルして現在の形に。
現状は月に20人ぐらいのアクティブユーザーといったところ。
特に告知などしてなくて、ニュースサイトの古い記事や紹介されているブログ、twitter連携などから新規に登録・利用してくれている。
手前味噌。
設計もデザインも古くさくなってダサイのはすみませんだけど。
もともとわたしは「あれ?これ読んだっけ?持ってたっけ?」のトリ頭、重複買いがわりとあったのに、「既読・未読」フラグのあるこのweb本棚のおかげで重複買いはなくなった(ログインして検索、あるいは、twitterにリプを飛して本棚検索結果を返してもらう)
『「趣味は読書2」など読書記録WEBサービス』
2011年時点のWEB本棚サービスのリスト。なくなったサービスがけっこう多いけど。
本を読むひとの数を増やしたい、小説を面白がってくれるひとを増やしたい、たくさん面白い小説を読みたい、というのはどのサービス提供者にも共通することだと思うんで、みんなで盛り上げられればいいなあ、と思うですよ。
面白い小説はまだまだたくさんあるので、残り時間を有効に使わないとなあ、とあらためて初老はしみじみするのでありました。
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」
19世紀のオマイラ

米川正夫訳の「地下生活者の手記」(河出書房ドストエーフスキイ全集5)を写経してるんだけど、こりゃとんでもないしろもの。びっくり。
わたしは単に意地悪な人間ばかりでなく、結局なにものにもなれなかった。悪人にも、善人にも、卑劣漢にも、正直者にも、英雄にも、虫けらにもなれなかった。
いやもう世の中に対する呪詛にこじらせてくどい自意識に…おもしろくってしょうがない。
まだ「第一 地下の世界」で、このわくわく感。
見栄をはってもしょうがないのでぶっちゃけると。
ドストエフスキーは北垣訳の『罪と罰』を電子書籍で読んでぶっとんだんだけど、『白痴』『賭博者』が途中放棄で、『悪霊』も『カラマーゾフの兄弟』も未読。
「地下生活者の手記」がこれほどとは。
ディックも平井和正も、ネットのこじらせたひとたちも、これに全部出てきてるような気がする。
ところで、諸君、わたしはいま諸君が聞くことを望むにしろ、望まないにしろ、なぜわたしが虫けらにさえなれなかったかというわけを、話して聞かせたいとおもう。堂々といってのけるが、わたしは今までなんど虫けらになりたいと思ったかしれない。けれども、わたしはそれにさえ値しない人間だったのだ。諸君、誓っていうが、あまり意識しすぎるということは、それは病気なのである。間違いのない本ものの病気なのである。
文中にかなりの頻度で「諸君」という呼びかけがはいってるんだけど、これって般若心経でいう「舎利子」だよなあ。
まずは写経をして、それから音声合成をする。
こんなブラックホールのような小説に音声をつけて聞きながら読むのはどんな体験になるのであろうか。
(図書館の返却期限が4/1なので、それまでには写経を終える予定…は未定)
[2016/01/01 09:24:05]
2016年1月1日。米川正夫訳の著作権が切れたので、ドストエーフスキイ『地下生活者の手記』を公開。
EPUB3電子書籍とテキストデータ
http://t2aki.doncha.net/release/chikaseikatsusya-no-syuki.zip
結局、音声合成作業は中断・断念。
作業してたんだけど、音声のクオリティを考えた時に、無料で使える音声としてはOtoya(Mac)やHaruka(WINDOWS)などのシステム音声の方が聞きとりやすいというのを実感。
ただ、システム音声をつけた電子書籍を公開することは権利的にできないので、そのかわりと言うのも変だけど「音声付きEPUB3電子書籍の作り方」についての説明ページを作った。
音声付きEPUB3電子書籍の作り方
http://t2aki.doncha.net/?id=1449791838
↓江川卓訳・新潮社版はこちら
» ローカル環境で電子書籍を作る、Macアプリ・Windows版ツール 「かんたんEPUB3作成easy_epub」