何か最近は検索エンジン用にサイトマップ情報をXMLで提供するプロトコルがあるらしい。
詳細はsitemaps.orgにあるらしいんで、見てみる。さりげに日本語版もあるな。
で、興味のある部分だけをざっと読む。
設置場所はどこでもいいのかと思ったが、設置場所と同等以下のパスしか拾わないらしい。要は、サイトマップファイルはツリーのルートに置いておけ、と。まあ自然だよな。セキュリティ的にも実装的にも。
検索エンジンへの通知は、robots.txtに書くか、検索エンジン側で規定したURLにpingを送るか、検索エンジンがそれぞれ勝手に作ったI/Fにどうにかするか、の三通りあるらしい。ふむ。robots.txtが楽だな。
つーか、WordPressだとGoogle XML Sitemapsプラグインを入れれば一発なんで、そうする。検索エンジンへの通知も勝手にやってくれるようだ。
でもまあ、robots.txtも書いておこうか。
…日本語版のプロトコル説明が変なことになってるな。
具体的には、以下の一行をrobots.txtに追加してください、となっている。
サイトマップ: <sitemap_location>
そこ翻訳しちゃ駄目だと思うんだ(笑)。
で、英語版を確認してみる。
Sitemap: <sitemap_location>
んじゃそれで。
うちの場合だと、
Sitemap: http://mk.miko.jp/blog/sitemap.xml
な訳だが、blog以外のとこに何かコンテンツを置こうと思った場合、複数Sitemapとかrobots.txtに書けるのかなあ。
ということで、良く見てみる。ふむ。複数のサイトマップを置く場合、サイトマップインデックスファイルとやらを作らないといけないようだ。めんどくせえなおい。
まあ、今のところmk.miko.jpはblog専用だから要らないな。こういうのは必要も無い時に急いで入れても損だ。普及が進めばツールの整備も進むもんだし。
そうそう、WWWCなどの更新チェッカーを使ってる場合、RSSフィードをチェック対象にするか、このsitemap.xmlを更新対象にするのがいいんじゃなかろうかとか。後者ならHEADで取れそうな気もするし。
ただ、コメントの変更を検知するにはコメントRSSフィードをチェック対象にしないと駄目な予感。二ヶ所チェックか、それともコメントはトップページのサイドバーを視認することでチェックするか、かなあ。うーん。WWWCのMetaタグに対応するプラグインとか無いすかね。