たった1行のコードでHTML取得&解析をしたい場合はexthtmlが便利

たった*行のコードでHTML取得&解析をしたい場合はWeb::Scraperが便利exthtmlを使った場合、こんな感じになります。

$ exthtml -x '//div[@id="topicsfb"]//li//text()' -a='Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)' http://www.yahoo.co.jp/

詳しくは、exthtmlの解説ページで。


cpan分からないという方には、phpのインスパイア版(exthtml.php)があります。

extphp -x '#topicsfb li' -v text http://www.yahoo.co.jp -a 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)'

詳しくは、digginリファレンスで(あ、exthtml.phpのこと書いてないや)