当前位置: 首页 - 编程技术 - 文章正文

网页抓取图片的php类,网页抓取图片的PHP类

xiaoqihv

简介:

header('Content-Type:text/html;charset=utf-8');

/**

* 一个用于抓去图片的类

*/

class download_image {

public $_save_path = NULL; //图片保存路劲

public $_limit_size = NULL; //图片限制大小

public static $_img_url_old = array();  //存储已抓取过的图片链接地址

public static $_a_page_url = array();    //存储抓取过的页面

public function __construct( $_save_path, $_limit_size) {

$this->_save_path = $_save_path;

$this->_limit_size = $_limit_size;

}

public function get_all_page_image( $site_url ) {

if ( $site_url == '' ) {

return false;

}

if ( ! in_array( $site_url, self::$_a_page_url ) ) {  //判断当前页面是否抓取过

self::$_a_page_url[] = $site_url;   //将超链接存入静态数组中

} else {

return;     //若抓取过则跳出

}

1.找到一个页面

2.正则过滤所有的img

3.正则过滤出所有的src的属性

4.获取链接信息,写入文件 file_get_contents(), file_put_contents()

5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)

文章地址:https://wenmayi.cn/post/1147.html