采用PHP5+ 开发的一个简单的 PHP HTML DOM 分析,支持 invalid HTML 并提供非常简单的方式来操作 HTML 元素。在 HMTL 页面
上查找标签所使用的语法与 jQuery (一个轻量级,实用的 javascript 框架) 相似,从页面中抽取内容只需要一行代码。开源代码:
http://sourceforge.net/projects/simplehtmldom/
// Create DOM from URL$html=file_get_html('http://slashdot.org/');// Find all article blocksforeach($html->find('div.article')as$article){$item['title']=$article->find('div.title',0)->plaintext;$item['intro']=$article->find('div.intro',0)->plaintext;$item['details']=$article->find('div.details',0)->plaintext;$articles[]=$item;}print_r($articles);