2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > PHP抓取网页内容获得网页源代码

PHP抓取网页内容获得网页源代码

时间:2020-12-18 12:27:19

相关推荐

PHP抓取网页内容获得网页源代码

1、 file_get_contents获取

[php]view plaincopy$url="/"; $fh=file_get_contents('/news/fzfj/'); echo$fh;

2、使用fopen获取网页源代码 [php]view plaincopy$url="/"; $handle=fopen($url,"rb"); $contents=""; while(!feof($handle)){ $contents.=fread($handle,8192); } fclose($handle); echo$contents;//输出获取到得内容。

3、使用CURL获取网页源代码

[php]view plaincopy$url="/"; $UserAgent='Mozilla/4.0(compatible;MSIE7.0;WindowsNT6.0;SLCC1;.NETCLR2.0.50727;.NETCLR3.0.04506;.NETCLR3.5.21022;.NETCLR1.0.3705;.NETCLR1.1.4322)'; $curl=curl_init();//创建一个新的CURL资源 curl_setopt($curl,CURLOPT_URL,$url);//设置URL和相应的选项 curl_setopt($curl,CURLOPT_HEADER,0);//0表示不输出Header,1表示输出 curl_setopt($curl,CURLOPT_RETURNTRANSFER,1);//设定是否显示头信息,1显示,0不显示。 //如果成功只将结果返回,不自动输出任何内容。如果失败返回FALSE curl_setopt($curl,CURLOPT_SSL_VERIFYPEER,false); curl_setopt($curl,CURLOPT_SSL_VERIFYHOST,false); curl_setopt($curl,CURLOPT_ENCODING,'');//设置编码格式,为空表示支持所有格式的编码 //header中“Accept-Encoding:”部分的内容,支持的编码格式为:"identity","deflate","gzip"。 curl_setopt($curl,CURLOPT_USERAGENT,$UserAgent); curl_setopt($curl,CURLOPT_FOLLOWLOCATION,1); //设置这个选项为一个非零值(象“Location:“)的头,服务器会把它当做HTTP头的一部分发送(注意这是递归的,PHP将发送形如“Location:“的头)。 $data=curl_exec($curl); echo$data; //echocurl_errno($curl);//返回0时表示程序执行成功 curl_close($curl);//关闭cURL资源,并释放系统资源

转载自:

引用:

PHP抓取采集类snoopy介绍: /librarys/veda/detail/855

PHP获取网页内容的几种方法:

/code/snippet_861770_19638

/tutorial/php//052534/

UserAgent设置不当导致php抓取网页失败:

/tutorial/php//111846/

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。