PHP 如何提取网页内容给你写了个php小偷程序,不算好,只是把关键技术写出来了,不是很完善.
php教程
?php
class fetch {
private $url="";
private $dir="";
private $file="";
private $bfile="";
private $cachetime=3600;//缓存储时间
private $content ;//目标的数据,字符串类型
function open (){
if (!$filearray=file($this-url.$this-dir.$this-file))
die ("无法打开目标网页");
$this-content=implode("",$filearray);
}
function check (){
if (!file_exists("./cache/$this-bfile") or (filemtime("./cache/$this-bfile") $this-cachetime)time()){
$fp=fopen("./cache/$this-bfile","w");
fwrite($fp,$this-content);
fclose($fp);
}
}
//cut 函数不实用,应该改为正则,我懒得改了,在类外部实现
function cut ($first,$end){
$this-content=explode($first,$this-content);
$this-content=explode($end,$this-content[1]);
$this-content=$this-content[0];
}
function get($property_name){
if(isset($this-$property_name)){
return($this-$property_name);
}
else{
return(NULL);
}
}
function set($property_name,$value){
$this-$property_name=$value;
}
}
?
//盗百度图片
html
!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ""
html xmlns=""
head
meta http-equiv="Content-Type" content="text/html; charset=gb2312" /
title创点教程网/title
/head
body
h1align="center"创点教程网/h1
?php
require_once ("fetch_class.php");
$fh=new fetch;
$fh-set("url",";cl=2lm=-1tn=baiduimageword创点教程网");
$fh-set("bfile","pic.html");
$fh-open();
$fh-check();
$content=$fh-get("content");
$search="/img src=https://www.04ip.com/post/(. ?)/is";
$re=array();
$match=preg_match_all($search,$content,$re);
$count=count($re[0]);
for ($i=0;$i=$count;$i){
echo $re[0][$i] ;
}
?
用PHP获取网页部分数据如果你要
和
之间的所有源码,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的
标签中的内容,可以用preg_match_all //提取所有代码 $pattern = '/
(. ?)
/is'; preg_match($pattern, $string, $match); //$match[0] 即为
和
之间的所有源码 echo $match[0]; //然后再提取
之间的内容 $pattern = '/(. ?)li/is'; preg_match_all($pattern, $match[0], $results); $new_arr=array_unique($results[0]); foreach($new_arr as $kkk){ echo $kkk; }
PHP抓取网页指定内容?php
/*
* 如下:方法有点笨
* 抓取网页内容用 PHP 的正则
* 用JS每隔5分钟刷新当前页面---即重新获取网页内容
*
* 注: $mode中--title/title-更改为所需内容(如 $mode = "#a(.*)/a#";获取所有链接)
*
* window.location.href="";中的
* 更改为自己的URL----作用:即刷新当前页面
*
* setInterval("ref()",300000);是每隔300000毫秒(即 5 * 60 *1000 毫秒即5分钟)执行一次函数 ref()
*
* print_r($arr);输出获得的所有内容 $arr是一个数组 可根据所需输出一部分(如 echo $arr[1][0];)
* 若要获得所有内容 可去掉
*$mode = "#title(.*)/title#";
if(preg_match_all($mode,$content,$arr)){
print_r($arr);
echo "br/";
echo $arr[1][0];
}
再加上 echo$content;
*/
$url = ""; //目标站
$fp = @fopen($url, "r") or die("超时");
$content=file_get_contents($url);
$mode = "#title(.*)/title#";
if(preg_match_all($mode,$content,$arr)){
//print_r($arr);
echo "br/";
echo $arr[1][0];
}
?
script language="JavaScript" type="text/javascript"
--
function ref(){
【php如何提取网页数据 php截取网页指定内容】window.location.href="";
}
setInterval("ref()",300000);
//--
/script
关于php如何提取网页数据和php截取网页指定内容的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息 , 记得收藏关注本站 。
推荐阅读
- html5手机端在线文档,html 手机端
- 喷火格斗游戏的简单介绍
- mysql浮点怎么设置 mysql存储浮点型数据
- 婚纱拍摄夏天穿什么,拍婚纱照适合穿什么鞋
- 游戏的绝杀动作,绝杀效果
- vb.net中文版下载 vbnet com
- sap用户信息系统,sap用户参数设置
- 小程序新趋势杂谈怎么写,小程序未来的挑战与风险
- jquery合计列,jquery 列表实现