Diggin のロードマップ

0.7での予定


Diggin_RobotRules(仮称)の搭載
robots.txtをメインにREP(Robot Exclusion
Protocol)などのパース・ハンドル(Zend_Http_Clientのインスタンスを渡したら判定など)・書き込み
を目的としたコンポーネント名前空間で、基本的にリクエストを送る側(ロボット側)よりの実装にします。
robots.txtにはRFCそのものが確かなかった訳のため、判定方法はrobotstxt.orgやREP情報や
ほかののモジュール(cpan、jspiderなど)を参考に作ろうとしてます。0.7ではハンドルが一応できる程度に留めます。


なおlaboratoryにパースまでできるものがありますが、これはたぶん捨てます。


Diggin_Service_Wedataの変更
ネタで全部staticにコール可能&プロパティに保持などというひどい実装でしたが、下記のとおり変更します。
http://diggin.googlecode.com/svn/standard/incubator/library/Diggin/Service/Wedata.php
一部メソッドの引数順序も変わります。


ーー 0.8, 0.9, 1.0 ーー

Diggin_Mechanize(仮)の導入をもってversionを1.0とする予定です。(多分あと5年以上はかかる気がするのでPHP使ってないかも知れませんが。。。)
その準備・実験段階として、Scraper_Helper機能導入と、shevron(Zend_Http_Client系の作者、Zend
Serverの開発にも携わっている)が作ったspizerのfork、機能追加を行っています。
http://github.com/sasezaki/spizer/tree/master