PHPのMechanizeの例外処理

そもそもPHPにMechanizeはないけど!! RubyのWWW::Mechanizeの例外処理 http://june29.jp/2007/12/02/ruby-mechanize-rescue-exception/ ↑のサンプルが簡略かされてるんで処理がよく見えないけど、 URLのリストがあって、それにバンバンアクセスするって場…

twitterでfollowしてるIDをwassrで購読するスクリプト

http://coderepos.org/share/browser/lang/php/Scraper/demos/Diggin/twitterfollow2wassr.php 4日前は使えたけど今使えるかは知らない。

Diggin 0.4.0リリース

3ヶ月以上前にバージョン0.3としてリリースしたDigginパッケージを、この度最新のリビジョン分を反映し、ヴァージョン0.4としてリリースします。また、サイトの方リニューアルしました。(デザインだけ) http://diggin.musicrider.com/ もうそろそろライブラ…

firefox3のcookies.sqliteからクッキーを流用する(てきとー編)

(例)tumblrのfollowingページにアクセスするとき

commitぼしゅう

個人的にZend_Http_Client_Adapter_Testが貧弱というか、 「3回に1回ぐらい404ステータスで帰せよ。おもしろくないなあ*1」とか、思っててテストアダプタ改変したの作り始めたんですけど、ZF関係なしにリクエストテスト用のライブラリとかあるんかなあ。 ま…

変えちゃった

Pathtraq を Zend Framework から呼び出すクラスを作って、CodeRepos にコミットしてみた。 Pathtraq for Zend Framework を作った - Heavens hell のコードですが、PHPはCLIでしか使わない僕のために変えちゃいました。(>_ http://coderepos.org/share/chan…

くうはく〜?

そこに、strip_tagsでタグを除去し、trimして左右の空白を取り除くことで、純粋な発言内容だけを取り出してきている、というわけです。 http://d.hatena.ne.jp/sotarok/20080725/php_study_34_simplexml_code twitterは試しのポストをしたところ、ポストの際…

php5.3を使うまえにみんなに知ってもらいたいこと。--世界はすばらしいってこと

D:\zip\php5.3-win32-200807221230>php -r "var_dump(PHP_VERSION, PHP_OS); string(9) "5.3.0-dev" string(5) "WINNT" D:\zip\php5.3-win32-200807221230>php -r "print_r(get_include_path()); .;D:\workspace\trunk\library;D:\workspace\incubator\libra…

ついでに絶対URLの取得ベンチマーク

スクレイピングにほとんど必須な作業に、相対パスからhttp://〜のURLを導きだす作業があるわけですが、Diggin_ScraperのデフォのアダプターにしているHTMLScraping classなんかは、正規表現+pearのNet/URLを組み合わせた関数(getAbsoluteUrl)が用意されてま…

簡単なタグのぶっこぬきなら正規表現すっっべっきー

http://blog.wozozo.org/archives/110 Zend_Dom_Queryの実験でもあるのにそれにつっこむのも野暮だけど。 「//html」とか「//title」てのは、そのタグの入れ子が複数あるように見えて変。 (ニコ動のアカウントもってないんだけど、ログインしてるともしかし…

ニコニコ動画にアップロードって「公開」じゃないよね〜

俺、ニコニコ動画のアカウントもってないがな。 http://techtalk.jp/2008/07/php2008.html PHPの今とこれから 2008 -廣川類 PHPでつくる ぐるなび -佐藤史彦 楽天xPHP楽天におけるPHPの過去・現在・未来 - 安藤祐介 大規模向けパッケージソフトウェアとPHP- …

「はてなスター」チェックにチャレンジ

http://perl-mongers.org/2008/07/post_4.html setCookieJar(); $client->setUri('http://w…

Zend_Dom_Queryで遊ぶ

高木さんとこの日記 http://d.hatena.ne.jp/takagimasahiro/20080717 で、Zend_DomとかあったんでincubatorとZend_Httpしかチェックしてなかった私は、ん?とか思ったんですが、いきなりstandardのsvnに入ってるんですね。 あれー、Zend_Http_Response_Parse…

pearパッケージ版に関する告知

http://d.hatena.ne.jp/sasezaki/20080428#p1 で用意したDigginパッケージですが、 channelを「__uri」にするはずが、 pear.php.netのままにしてしまっていてました。気になる方は削除を。 (pear listで出ちゃう(>_ 以後きをつけます。

今日のDiggin_Scraperチップス#2

TwitterにいるPHPのすごい人リストぶっこぬき process('//div[@class="post-content"]/ul/li/a', 'phper => ["TEXT", "Alnum"]') // ->scrape('http://www.1x1.jp/blog/2008/05/twitter_japanese_phper.html'); //var_dump($scraper->results['…

今日のDiggin_Scraperチップス#1

Zend FrameworkとDiggin_Service_Wedata::getItems('AutoPagerize')とDiggin_Scraperで 複数ページにまたがるサイトを保存する。 http://coderepos.org/share/browser/lang/php/Scraper/demos/Diggin/autopagerizing_download.php ↑これを使うとURLを設定す…

やったーWedata用のPHPライブラリできたよー\(^o^)/

http://coderepos.org/share/browser/lang/php/Diggin_Service_Wedata/library/Diggin/Service/Wedata.php 注意. 全ての関数は、スタティックにコールできます使い方とか(メソッド名変えるかも) setApikey('XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'); $weda…

apiのhelpにHTTP methodがDELETEでパラメータとか書かれてたときは、、、

http://wedata.net/help/api setMethod(HTTP_REQUEST_METHOD_DELETE); $req->addQueryString('api_key','xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'); $req->sendRequest(); print_r($req->getResponseCode()); こう…

pearパッケージ化を久々にしました。

"Diggin"ライブラリを久々にpearパッケージ化しました。 pear導入済みなら pear install http://diggin.musicrider.com/Diggin.tgz でインストールできます。前回から色々モジュールを追加しましたが、 今回一番量として大きいのは、codereposやこの日記で小…

Munohを叩くライブラリ作った

http://coderepos.org/share/browser/lang/php/Diggin_Service_Munoh http://labs.unoh.net/2008/04/api.html*注*バグが多いので萌えボイスがゲットできるはずなのにできていません。 codereposに入れたので誰かハッカーに修正していただきたいとおもいま…

第2回PHP懇親会へ行ってきた。

http://events.php.gr.jp/event.php/event_show/38 てことで、発表資料と写真 http://diggin.musicrider.com/files/konshinkai2.phps http://kazusuke.tumblr.com/

scrapeのとこの改訂のお知らせ

http://diggin.googlecode.com/svn/trunk/library/Diggin/Scraper/ svnのコミット見れば分かるし、Digginライブラリ自体誰も使ってなさそうのでどうでも良いかもしれませんが、 現在のデフォルト(xmlobjectで読み込んでxpathで解析)の場合、 HTMLScraping Cl…

xpath vs simpleTag vs 正規表現 ? 全部出来ればいいんじゃないのかな?

作成中 http://diggin.googlecode.com/svn/trunk/library/Diggin/Scraper/ http://code.google.com/p/diggin/source/browse/trunk/library/Diggin/Scraper/

PHP/FI2ユーザー

PHP/FIって、私も触った事はありませんw 廣川さんぐらいじゃないのかなぁ。 http://d.hatena.ne.jp/shimooka/20080131/1201746978 で、思い出したかのように今日 PHP Community Trading Cards http://www.flickr.com/photos/calevans/sets/7215760264877556…

PHP勉強会はどのくらいの早さで枠が埋まるのか

下みたいな感じでtimestampの差とる形でうんにゃこりゃやってたんだけど、 なんか色んな意味でダメだなあ。

SimpleXMLElementでTwitterのスクレイピング(だめな例)

PHP+SimpleXMLElementでTwitterのスクレイピング - GRANADA Hatena @ sotarok http://d.hatena.ne.jp/sotarok/20080121/1200889073 ZFとtidyのだめな例だとこうかな?(というか以前に作った中途半端なScrapeクラスの場合)

デザインと日記名変えた

前のデザインだとコード貼った時に見づらかったので、 暫定的に、もしcan族http://moshican.g.hatena.ne.jp/sasezaki/ のほうにポストしてたんだけど、 横断するのが面倒なのとコードにツッコミいれてもらうようにするため変えてみた。

PHP勉強会のレポの次期なんで、 私も一ヶ月前の懇親会のやつのソースの場所貼っときますね(今さら) http://diggin.googlecode.com/svn/trunk/

ナタリーがいつまでまっても要求をのんでくれない http://natalie.mu/bbs/show/id/21 てことで、natalieカレンダーからical生成スクリプト。 icalcreatorクラスがあんまりきれいにやってくれないからあとで修正必要 こういう野良がはびこるのが嫌だったらica…

最近、更新してるのは以下のとこ http://kazusuke.tumblr.com/ http://twitter.com/sasezaki