ここんとこいっぱい

ECS4.0の情報が思ったように検索できない、かな。AWS3.0ベースの記事とか、あっても2年ほど前の内容だったり。パラメータが微妙に違ってたり。他力本願寺してないで、自分でアマゾンの英語の一次資料を読めよ、てことなんだろうけど、横文字はわからん・好かん、のだ。
とりあえず、二次情報をありがたく拾わせてもらって、ちょっと試してみたところイケそうな感触。uriを作って、LWPで問い合わせて、取得したXMLをXML::Simpleで欲しいものだけ抽出、てところまで意外とあっさり。今の読書SNSと同じく、フランス、ドイツのアマゾンからもデータ取得はできた、っぽい。RESTの方が早い(SOAPと比べて)という話はたぶん本当で、キーワード検索の結果がかえってくるのがあっと言う間だったんで驚いた。ただ、一度に取れるのは1ページ10アイテム。バッチリクエストというやつでも2ページまで、らしい。Net::Amazonだとざくっと取ってこれたけど、これってNet::Amazonがページ設定してんのかなあ。ソース読めよ、か。1秒1リクエストという制約があるのでsleepが入ってそうな…。
てことでちょっとNet::Amazonをのぞいてみたらちゃんとsleepいれてた。でもってmax_pagesてのもあったからページ制御も、だろう。当たり前か。ありがたく流用させてもらおう。
ところで。Amazon.pm以下に、試しに perl -wcしたら サブルーチンがredefinedというwarningがぞろっと。うううむ 一方から use base していて、use baseでrequireされてる側ではrequireしてきたpackageをuseしてる。 そりゃ再定義してますよ、と。
これってありがちなのかなぁ。謎。
あとは取るデータをどうするか。
著者ってのはCreatorのcontentなのか、それとも文字どおりAuthorを使うのが本当なのか。
ざらっと眺めてみるとデータとしてCreatorの方がしっかりしてそうだけど、本てのは「著者」だもんなあ。
EAN、ISBN、ASINとあるけど、どれをキーにするのか。アマゾンはずっと10桁のASINでいくと言い切っちゃってるんで、アマゾンを利用する以上は、10桁のASINが便利。だけど、世界標準は13桁のEAN。どうせ取得できるんだし、両方とも取るだけ取っておいて、変換テーブルに溜め込んでいくか。
あらためて今さら、データの宝庫ぢゃん。アマゾンはおもしろい。
んで実はそれどころじゃなくて、わが家の王が、大ぴんち。よたよた漏らしながらも、一時、食欲も戻り目に力も戻ったと思ったのに。おとといあたりからまた具合が悪くなって医者通い。点滴が続く。ウチでもおこたからほとんど出ないで寝たまんま。心配で落ち着かない。
おまけに奥歯のブリッジが取れていよいよ入れ歯かと、気持ちが暗いところにもってきて、さらに萎える。
うううむ。あれこれいろいろいっぱいいっぱい。ううううう。
[02/01 00:42:15]
で、あれこれ検索していて
Amazonのデータ。 Creator はあるのに Author がないパターンがあるという情報に驚く。著者名なし、てのはこれか。ないかも知れないデータをアテにすることはできない。本来補助的に使われるらしいCreatorを著者に拾うかなぁ。
で、帰ってみたらうちの王様がご飯をムシャムシャと。点滴の威力なのか、やっぱり食欲魔人なのか。
| << | 2026/3 | >> | ||||
|---|---|---|---|---|---|---|
| 日 | 月 | 火 | 水 | 木 | 金 | 土 |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 | ||||
【最近の10件】


