東京都立図書館

2006/9/28 [00:07:59] (木) 天気

趣味は読書SNSに絡めて東京都の図書館蔵書横断検索というのが使えるかも、と画策してたのが前回までのあらすじ。えーっと伏線は追加記入分ね。


!/usr/local/bin/perl


use LWP::UserAgent;


my $ua = LWP::UserAgent -> new;

my $url_root = ’http://metro.tokyo.opac.jp/’;

my $url_post = $url_root . ’cgi-bin/j12crs2.cgi’;

my $que = ’sitechk001049=on&isbn=439663059X&srchmode=2&’;


my $req = HTTP::Request->new(POST => $url_post);

$req->content_type(’application/x-www-form-urlencoded’);

$req->content( $que );

my $res = $ua->request($req);


my $str = $res->as_string;

print $str;


↑これだけで、葛飾区の図書館を対象に、楢山芙二夫『非情の追跡』探してくる。ヒットしたら収蔵する図書館へのリンクと書誌詳細へのリンクが出てくる。ので、今度はそのリンクを開いてGETすれば詳しい情報も取れる。


問題は。とってきたHTMLを睨み倒して、必要なところを自動的に切り取るスクリプト。

わたしのトップページに、さりげなくかつわざとらしく、フジTVめざましテレビの星占いを貼り付けてあるけど、これも同じようなやり方(この頃はLWPなんて便利なモジュール知らなかったんで、socketだのbindだのガシガシと)やはり、番組改編なんかで、HTMLのデザインが変わるだけでアウトとなる。


東京都立図書館というパブリックサーバントがやってるんだから、納税者の利便を考えてXMLとかテキトーな統一規格(APIというんだっけか)にして欲しいなぁ。


臨時雇い派遣の身ながら、仕事がまだ回ってこないのでヒマ。いちんち中ぼーっとテレビみてボケていく定年後のオトウサン状態。

なもんで、ちっとうろついて見つけたのが

http://knezon.knecht.jp/

↑これ。クネゾンというんだけど、これがすごいのひとこと。

図書館のデータというのは全国の図書館でバラバラの形式。もう蓄積もされてるんで、いまさら全国統一形式にするのは無理っぽいらしい。

ところがこのクネゾン。そのバラバラの形式を個別に対応してプログラムを作り、検索サービスを提供しているのだ。こういうのを見せられると(そのポリシーも含めて)素直に脱帽。かっこええっすよ。


とりあえず。東京都に関しては都立図書館に頑張ってもらえれば、そこを橋頭堡に都内の図書館を検索してごにょごにょできそう、かなぁ。


TOKYO図書館紀行

『TOKYO図書館紀行』

<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】