ここんとこいっぱい

2008/1/31 [09:42:49] (木) 天気

ECS4.0の情報が思ったように検索できない、かな。AWS3.0ベースの記事とか、あっても2年ほど前の内容だったり。パラメータが微妙に違ってたり。他力本願寺してないで、自分でアマゾンの英語の一次資料を読めよ、てことなんだろうけど、横文字はわからん・好かん、のだ。

とりあえず、二次情報をありがたく拾わせてもらって、ちょっと試してみたところイケそうな感触。uriを作って、LWPで問い合わせて、取得したXMLをXML::Simpleで欲しいものだけ抽出、てところまで意外とあっさり。今の読書SNSと同じく、フランス、ドイツのアマゾンからもデータ取得はできた、っぽい。RESTの方が早い(SOAPと比べて)という話はたぶん本当で、キーワード検索の結果がかえってくるのがあっと言う間だったんで驚いた。ただ、一度に取れるのは1ページ10アイテム。バッチリクエストというやつでも2ページまで、らしい。Net::Amazonだとざくっと取ってこれたけど、これってNet::Amazonがページ設定してんのかなあ。ソース読めよ、か。1秒1リクエストという制約があるのでsleepが入ってそうな…。


てことでちょっとNet::Amazonをのぞいてみたらちゃんとsleepいれてた。でもってmax_pagesてのもあったからページ制御も、だろう。当たり前か。ありがたく流用させてもらおう。

ところで。Amazon.pm以下に、試しに perl -wcしたら サブルーチンがredefinedというwarningがぞろっと。うううむ 一方から use base していて、use baseでrequireされてる側ではrequireしてきたpackageをuseしてる。 そりゃ再定義してますよ、と。

これってありがちなのかなぁ。謎。


あとは取るデータをどうするか。

著者ってのはCreatorのcontentなのか、それとも文字どおりAuthorを使うのが本当なのか。

ざらっと眺めてみるとデータとしてCreatorの方がしっかりしてそうだけど、本てのは「著者」だもんなあ。

EAN、ISBN、ASINとあるけど、どれをキーにするのか。アマゾンはずっと10桁のASINでいくと言い切っちゃってるんで、アマゾンを利用する以上は、10桁のASINが便利。だけど、世界標準は13桁のEAN。どうせ取得できるんだし、両方とも取るだけ取っておいて、変換テーブルに溜め込んでいくか。


あらためて今さら、データの宝庫ぢゃん。アマゾンはおもしろい。


んで実はそれどころじゃなくて、わが家の王が、大ぴんち。よたよた漏らしながらも、一時、食欲も戻り目に力も戻ったと思ったのに。おとといあたりからまた具合が悪くなって医者通い。点滴が続く。ウチでもおこたからほとんど出ないで寝たまんま。心配で落ち着かない。


おまけに奥歯のブリッジが取れていよいよ入れ歯かと、気持ちが暗いところにもってきて、さらに萎える。


うううむ。あれこれいろいろいっぱいいっぱい。ううううう。



[02/01 00:42:15]

で、あれこれ検索していて

Amazonのデータ。 Creator はあるのに Author がないパターンがあるという情報に驚く。著者名なし、てのはこれか。ないかも知れないデータをアテにすることはできない。本来補助的に使われるらしいCreatorを著者に拾うかなぁ。


で、帰ってみたらうちの王様がご飯をムシャムシャと。点滴の威力なのか、やっぱり食欲魔人なのか。


Amazon Web Services ガイドブック クラウドでWebサービスを作ろう!

『Amazon Web Services ガイドブック クラウドでWebサービスを作ろう!』

Jeff Barr

<<2026/1>>
    123
45678910
11121314151617
18192021222324
25262728293031
検索:

【最近の20件】