php来熟练抓取数据 php爬虫数据采集( 三 )


'error_page'
=
'/login',
'save_login'
=
'1',
'submit'
=
'现在登录'
);
//登录地址
$url
=
"";
//设置cookie保存路径
$cookie
=
dirname(__FILE__)
.
'/cookie_oschina.txt';
//登录后要获取信息的地址
$url2
=
"";
//模拟登录
login_post($url,
$cookie,
$post);
//获取登录页的信息
$content
=
get_content($url2,
$cookie);
//删除cookie文件
@
unlink($cookie);
//匹配页面信息
$preg
=
"/td
class='portrait'(.*)\/td/i";
preg_match_all($preg,
$content,
$arr);
$str
=
$arr[1][0];
//输出内容
echo
$str;
使用总结
1、初始化curl;
2、使用curl_setopt设置目标url,和其他选项;
3、curl_exec,执行curl;
4、执行后 , 关闭curl;
5、输出数据 。
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
php 怎么POST获取数据?方法1、最常见的方法是:$_POST['fieldname'];
说明:只能接收Content-Type:
application/x-www-form-urlencoded提交的数据
解释:也就是表单POST过来的数据
方法2、file_get_contents("php://input");
说明:
允许读取
POST

原始数据


$HTTP_RAW_POST_DATA
比起来,它给内存带来的压力较小,并且不需要任何特殊的
php.ini
设置 。
php://input
不能用于
enctype="multipart/form-data" 。
解释:
对于未指定
Content-Type
的POST数据,则可以使用file_get_contents(“php://input”);来获取原始数据 。
事实上,用PHP接收POST的任何数据都可以使用本方法 。而不用考虑Content-Type,包括
二进制文件
流也可以 。
所以用方法二是最保险的方法
方法3、$GLOBALS['HTTP_RAW_POST_DATA'];
说明:
总是产生
$HTTP_RAW_POST_DATA
变量包含有原始的
POST
数据 。
此变量仅在碰到未识别
MIME
类型的数据时产生 。
$HTTP_RAW_POST_DATA
对于
enctype="multipart/form-data"
表单数据不可用
如果post过来的数据不是PHP能够识别的,可以用
$GLOBALS['HTTP_RAW_POST_DATA']来接收,
比如
text/xml
或者
soap
等等
解释:
$GLOBALS['HTTP_RAW_POST_DATA']存放的是POST过来的原始数据 。
$_POST或
$_REQUEST
存放的是
PHP以key=value的形式格式化以后的数据 。
但$GLOBALS['HTTP_RAW_POST_DATA']中是否保存POST过来的数据取决于centent-Type的设置,即POST数据时
必须显式示指明Content-Type:
application/x-www-form-urlencoded,POST的数据才会存放到
$GLOBALS['HTTP_RAW_POST_DATA']中
php每天抓取数据并更新新以前我用过querylist插件抓数据,服务器写和定时器,每天固定时间去运行脚本 。朝这个方式试试
高并发下数据的更新,应该 update table xxx set num = num - 1 的方式,这种方式可以保证数据的正确性 。
但是会出现 num 为负数的问题,如果库存为负数,显然是不合理的 。
于是 , 需要将 num 字段设置为 无符号整型,这样就不会出现负数了,因为,如果减到负数,就会更新失败 。
但是这种依然会造成很多无用的更新语句的执行,是不合理的 。
于是,update table xxx set num = num - 1 where num0 , 
这样当 num 等于0之后就不会去更新数据库了,减少了很多无用的开销 。
这种方式被称作“乐观锁”

推荐阅读