robots.txtの仕様

トラックバックありがとうございます。
http://arton.no-ip.info/diary/20061013.html#p02
http://recompile.net/2006/10/robotstxt.html

深いディレクトリをクロールしようとしたら、各階層を絨毯爆撃しなきゃいけなくなる

確かにそうだ。

ところで素朴な疑問が湧いた。これまでhttp://arton.no-ip.info/diary/以下はgooglebotにクロールされていなかったのだろうか。

いくつかキーワードを"arton"とあわせてGoogleで引いてみると、キャッシュはされていない。またタイトルはindexingされているが本文はされていないらしい。

http://static.flickr.com/108/268626441_93e9d285ac.jpg