ニノミヤの会社更生とか、林先生が今まで独身だったとか、いろいろ起こりますな。
アクセスログを見ていたら、
202.217.35.16 - - [09/Jan/2005:16:12:37 +0900] "GET /simm/d/ HTTP/1.1" 200 28021 "-" \ "ndl-japan-research-robot-1.1 (http://www.ndl.go.jp/jp/aboutus/bulkresearch2004/index.html) \ (http://e-public.nttdata.co.jp/bulkresearch2004/index.html)"
といったものが大量に残っていた。時間帯によっては、30秒毎に GET しに来ている模様。どうやら片っ端からリンクをたどってるらしい。
国会図書館(正確にはNTTデータか)がデータを集めにくるのはわからなくもないが、30秒毎はひどすぎる。もうちょっと何とかならないものか。
「デジタルアーカイブのための日本のウェブサイトの実態調査」のお知らせによると、robots.txt は見てくれる模様。とりあえずは、無意味に tb.rb をたどろうとする跡があったので、robots.txt に tb.rb を追加。しばらくはこれで様子を見ることにするが、サーバが負荷に耐えられないようなら、接続拒否するしかあるまい。
*Messages* の更新情報取得には、antenna.lirs もしくは index.rdfをご利用ください。 豪傑アンテナ の LIRSからも取得可能です。