在PHP中怎么解决大量数据处理的问题mysql_query函数查询的方式是查询出全部结果后缓存到内存中,这样就会出现超内存的现象,使用另外一个函数mysql_unbuffered_query可以解决这个问题,mysql_unbuffered_query不会缓存结果集 , 而是查询出来数据后立马对结果集进行操作,也就是便查询边返回,这样就不会出现超出内存的现象,但是使用mysql_unbuffered_query的是时候不能使用 mysql_num_rows() 和 mysql_data_seek() 。并且向 MySQL 发送一条新的 SQL 查询之前,必须提取掉所有未缓存的 SQL 查询所产生的结果行 。例如:
使用缓存结果集的代码:
function selecttest()
{
try {
$pdo = new PDO("mysql:host=localhost;dbname=test", 'root', '123456');
//不使用缓存结果集方式
//$pdo-setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
$sth = $pdo-prepare('select * from test');
$sth-execute();
echo '最初占用内存大?。? . memory_get_usage() . "\n";
$i = 0;
while ($result = $sth-fetch(PDO::FETCH_ASSOC)) {
$i= 1;
if ($i10) {
break;
}
sleep(1);
print_r($result);
echo '占用内存大?。? . memory_get_usage() . "\n";
}
} catch (Exception $e) {
echo $e-getMessage();
}
}
执行时将会报超出内存的错误:
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 204800000 bytes) in E:\ProgramDevelopment\RuntimeEnvironment\xampp\htdocs\test\test.php on line 56
Call Stack:
0.00051353921. {main}() E:\ProgramDevelopment\RuntimeEnvironment\xampp\htdocs\test\test.php:0
0.00051355682. test-selecttest() E:\ProgramDevelopment\RuntimeEnvironment\xampp\htdocs\test\test.php:85
0.00501425283. PDOStatement-execute() E:\ProgramDevelopment\RuntimeEnvironment\xampp\htdocs\test\test.php:56
将上面代码中的$pdo-setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);一行的注释去掉后将不在缓存结果集,这时运行该函数的结果如下:
最初占用内存大?。?44808
Array
(
[id] = 1
[a] = v
[b] = w
[c] = i
)
占用内存大?。?45544
Array
(
[id] = 2
[a] = b
[b] = l
[c] = q
)
占用内存大?。?45544
Array
(
[id] = 3
[a] = m
[b] = p
[c] = h
)
占用内存大?。?45536
Array
(
[id] = 4
[a] = j
[b] = i
[c] = b
)
占用内存大?。?45536
可以看到,这时返回一条数据内存占用非常的?。?也就700多字节,这样就不会出现超出内存的错误了 。
如何解决PHP查询大量数据内存耗尽的问题这个问题在PHP的官方网站上叫缓冲查询和非缓冲查询(Buffered and Unbuffered queries) 。PHP的查询缺省模式是缓冲模式 。也就是说,查询数据结果会一次全部提取到内存里供PHP程序处理 。这样给了PHP程序额外的功能 , 比如说,计算行数,将指针指向某一行等 。更重要的是程序可以对数据集反复进行二次查询和过滤等操作 。但这种缓冲查询模式的缺陷就是消耗内存 , 也就是用空间换速度 。
相对的,另外一种PHP查询模式是非缓冲查询,数据库服务器会一条一条的返回数据,而不是一次全部返回 , 这样的结果就是PHP程序消耗较少的内存,但却增加了数据库服务器的压力,因为数据库会一直等待PHP来取数据,一直到数据全部取完 。
很显然,缓冲查询模式适用于小数据量查询,而非缓冲查询适应于大数据量查询 。
PHP-大数据量怎么处理优化大数据的话可以进行以下操作:
减少对数据库的读取,也就是减少调用数据库,
进行数据缓存 ,
利用数据库的自身优化技术,如索引等
精确查询条件,有利于提高查找速度
php采集大数据的方案1、建议你读写数据和下载图片分开 , 各用不同的进程完成 。
比如说,取数据用get-data.php,下载图片用get-image.php 。
2、多进程的话 , php可以简单的用pcntl_fork() 。这样可以并发多个子进程 。
但是我不建议你用fork,我建议你安装一个gearman worker 。这样你要并发几个,就启几个worker,写代码简单,根本不用在代码里考虑thread?。琾rocess等等 。
3、综上,解决方案这样:
(1)安装gearman worker 。
(2)写一个get-data.php , 在crontab里设置它每5分钟执行一次,只负责读数据 , 然后把读回来的数据一条一条的扔到 gearman worker的队列里;
然后再写一个处理数据的脚本作为worker,例如叫process-data.php , 这个脚本常驻内存 。它作为worker从geraman 队列里读出一条一条的数据,然后跟你的数据库老数据比较,进行你的业务逻辑 。如果你要10个并发,那就启动10个process-data.php好了 。处理完后,如果图片地址有变动需要下载图片,就把图片地址扔到 gearman worker的另一个队列里 。
(3)再写一个download-data.php,作为下载图片的worker,同样,你启动10个20个并发随便你 。这个进程也常驻内存运行,从gearman worker的图片数据队列里取数据出来,下载图片
4、常驻进程的话 , 就是在代码里写个while(true)死循环,让它一直运行好了 。如果怕内存泄露啥的,你可以每循环10万次退出一下 。然后在crontab里设置,每分钟检查一下进程有没有启动,比如说这样启动3个process-data worker进程:
* * * * * flock -xn /tmp/process-data.1.lock -c '/usr/bin/php /process-data.php/dev/null 21'
* * * * * flock -xn /tmp/process-data.2.lock -c '/usr/bin/php /process-data.php/dev/null 21'
* * * * * flock -xn /tmp/process-data.3.lock -c '/usr/bin/php /process-data.php/dev/null 21'
不知道你明白了没有
PHP如何解决网站的大数据大流量与高并发使用缓存,比如memcache,redis,因为它们是在内存中运行,所以处理数据,返回数据非常快,所以可以应对高并发 。
2.增加带宽和机器性能,1M的带宽同时处理的流量肯定有限,所以在资源允许的情况下 , 大带宽,多核cpu,高内存是一个解决方案 。
3.分布式 , 让多个访问分到不同的机器上去处理,每个机器处理的请求就相对减少了 。
简单说些常用技术 , 负载均衡,限流,加速器等
【php如何处理大数据 php做大数据】关于php如何处理大数据和php做大数据的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。
推荐阅读
- 直播桌布素材,直播桌布素材图
- flutter样式,flutter css
- 公众号上标怎么编辑,公众号文章添加标签
- 钉钉直播彩六,钉钉现场直播
- linux命令方式关机 linux命令行关机
- 微信公众号视频哪个好用吗,微信公众号运营一年多少钱
- 与区块链有关的创意,关于区块链的宣传语
- 如何在公众号写文章app,如何在公众号写文章
- go语言子类构造方法 golang 构造函数