開発ブログ

ページメニュー

<< スクレイピングとWebAPI | main | phpCodeGenieで、テーブル編集のPHPを自動生成 >>

カレンダー

<< June 2017 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 >>

  • 他人のふんどし率〜htmlparser
  • 他人のふんどしチェックを作りました。

    htmlparserというモジュールの習作です。
    これを使って指定ページの内容を取得し、その中にあるリンクタグの確認を行っています。Frameタグ及びiFrameタグがある場合は、その内容を再帰的に辿っています。

    該当モジュールをrequireした後、
    require_once("htmlparser.inc");
    ページの内容を取得します。
    $htmlText = @file_get_contents( "http://24th.jp" );
    取得した値がnullでなければparseクラスに取得内容を渡し、whileparseしつづけます。
    $parser = new HtmlParser ($htmlText);
    while ($parser->parse()) {
      $tag=$parser->iNodeName;
      //リンクタグなら…
      if($tag=="a"){
        //href属性を取得したければ…
        $href=$parser->iNodeAttributes[ 'href' ];
      }
    }

    にしても、広告と外部リンクだけでできてるようなページも多いんですね。

    他人のふんどし率が高いページは、外部リンクを消すブックマークレットを使うと楽しいです。

| 開発関連 | 15:13 | comments(1) | trackbacks(0) |


コメント

ケイタイ版ドラクエ風メイル2の方は文字入力しても反映されません(;´д`)
ちなみにauです

『ふんどし』とは関係ないことで申し訳ないですが…(汗)

| PAPA | 2008/07/09 6:36 AM |

コメントする

この記事のトラックバックURL

http://blog.24th.jp/trackback/920333