PHP漏洞总结

基础漏洞、弱类型、伪协议、反序列化 基础知识补漏 php类型转换机制
php是一种弱类型语言,它支持的类型有:

boolean,integer,float,string,array,object,callable,resource,NULL
类型之间转换可能会发生一些有趣的事情,总结如下:
转化成boolean ""(空字符串),"0"(字符串零),0(整型零),0.0(浮点零),array()(空数组),NULL,尚未被赋值的变量,都会被认为是false。
任何资源,NAN,-1,都被认为是true。
字符串转化成数值 如果该字符串没有包含 '.','e' 或 'E' 并且其数字值在整型的范围之内(由 PHP_INT_MAX 所定义),该字符串将被当成 integer 来取值,其它所有情况下都被作为 float 来取值。
字符串的开始部分决定了它的值。
如果该字符串以合法的数值开始,则使用该数值。否则其值为 0(零)。
合法数值由可选的正负号,后面跟着一个或多个数字(可能有小数点),再跟着可选的指数部分。指数部分由 'e' 或 'E' 后面跟着一个或多个数字构成。
php比较机制
"==="和"!=="即strict比较符,只有在类型相同时才相等。
"=="和"!="即non-strict比较符。如果比较的两者类型不同,会在类型转换后进行比较:字符串在与数字比较前会自动转换为数字;两个字符串比较,如果两个都是数字形式,则同时转换为数字进行比较。
一些例子:
0 == " a" " 1" == " 01" " 100" == " 1e2" " 0E32" == " 0e21"

php官网给出了"=="比较的一些例子
php伪协议
php伪协议在ctf中的应用
php伪协议总结
协议有很多种,比如file://,http://,ftp://等等,但有的协议只在php中得到支持,故称伪协议。
php:// 用来访问各个输入输出流。
php.ini中有两个相关的设置
  • allow_url_fopen:默认值是ON,允许url里的封装协议访问文件
  • allow_url_include:默认值是OFF,不允许包含url里的封装协议包含文件
php://input php://input代表可以访问请求的原始数据,简单来说POST请求的情况下,php://input可以获取到post的数据。要求allow_url_include = ON
比较特殊的一点,enctype=”multipart/form-data” 的时候 ,php://input 是无效的。
php://filter 常用,任意文件读取,双OFF时可以使用。
用于将读取的数据经过一些过滤器,进行输出。
php://filter 目标使用以下的参数作为它路径的一部分。 一个路径上可以指定很多过滤器,形成一个过滤链。路径是用/作为分隔。
resource=< 要过滤的数据流> 这个参数是必须的。它指定了你要筛选过滤的数据流。 read=< 读链的筛选列表> 该参数可选。可以设定一个或多个过滤器名称,以管道符(|)分隔。 write=< 写链的筛选列表> 该参数可选。可以设定一个或多个过滤器名称,以管道符(|)分隔。 < ;两个链的筛选列表> 任何没有以 read= 或 write= 作前缀 的筛选器列表会视情况应用于读或写链。

举例说明:php://filter/read=string.rot13/resource=xxx 是对xxx这个resource进行rot13字母的操作,再输出。
下面是可转伪协议的字串中直接使用的的一些过滤器函数:
  • 字符串过滤器
string.rot13 string.toupper string.tolower string.strip_tags

  • 转换过滤器
convert.base64-encode convert.base64-decode convert.quoted-printable-encode convert.quoted-printable-decode

data:// 需要双ON的时候才可以使用。
将用户输入的信息以流的形式传入,需要allow_url_include = ON。这个协议并非伪协议,可以参考? RFC 2397的格式。
dataurl:= " data:" [ mediatype ] [ " ; base64" ] " ," data mediatype:= [ type " /" subtype ] *( " ; " parameter ) data:= *urlchar parameter:= attribute " =" value

在URL中和在代码中的写法不太一样。URL中的写法示例:data:text/plain; base64,PD9waHAgc3lzdGVtKCJuZXQgdXNlciIpPz4=,代码中的写法示例:file_get_contents(' data://text/plain; base64,SSBsb3ZlIFBIUAo=' )
下面举例:
  • data:text/plain,...
< ?php @include($_GET[" file" ]); ?> url: ...?file=data:text/plain,< ?php system(" net user" )?> result: user information

  • data://text/base64,...
< ?php @include($_GET[" file" ]); ?> url: ...?file=data:text/plain; base64,PD9waHAgc3lzdGVtKCJuZXQgdXNlciIpPz4= result: user information

  • data://image/jpeg; base64,...
< ?php $jpegimage = imagecreatefromjpeg(" data://image/jpeg; base64," . base64_encode($sql_result_array[' imagedata' ])); ?> 图片木马

phar://及其他压缩协议 这些协议在双off的时候也可以使用。
phar:// phar,官网叫做php归档。实际上这是一个用于解压缩的协议,具体使用方法如下:phar://[待解压缩文件路径+文件名(包含后缀)]/[解压后的文件名称(包含后缀)]
值得注意的是:虽然强制要求必须写上后缀名,但待解压的文件只要文件格式是zip(其他压缩格式有待实验)即可,对后缀名的形式并没有要求。利用这个特性,经常可以进行一些绕过的操作。
例如:
/about.php?file=phar://./images/file.jpg/1.php [这是把想要上传的php文件打包成了压缩包,又更改成了jpg后缀进行绕过,上传,然后利用phar的解压还原成原来的文件。]

zip:// zip协议和phar非常类似,只不过它的格式有些差别,并且只能解压zip:zip://[待解压缩文件路径+文件名.zip]#[解压后的文件名称(包含后缀)]。在URL中会忽略#号后面的内容,所以要对它进行URL编码:zip://test.zip%23file.txt
bzip2://和zlib:// 前者只能解压后缀名为bz2的bzip2文件,后者只能解压后缀名为.gz的文件。用法和上述协议类似,举例如下:
?file=compress.bzip2://[绝对路径]/test.bz2 ?file=compress.bzip2://./test.bz2?file=compress.bzip2://[绝对路径]/test.gz ?file=compress.bzip2://./test.gz

这些不常用的协议可以在常用协议被禁止的时候作为备选项。
反序列化与漏洞 反序列化只是一个特性,真正造成漏洞的是用户可控。通过反序列化这个例子可以体会到一些关于漏洞挖掘的思想。
序列化:对象转化为字符串。反序列化:带有格式的字符串转化成对象。
想要序列化,只要写一个php脚本,模拟要序列化的类即可。在反序列化的过程中,会调用一系列的函数。如果能够利用这些函数或者它们调用的函数,找到这个链条上的危险函数,并且变量可控,即可进行攻击。
魔术函数
常规
  • __construct() 构造函数,对象new(创建)时自动调用
  • __destruct() 析构函数,对象销毁时自动调用
  • __call()是在对象上下文中调用不可访问的方法时触发
  • __callStatic()是在静态上下文中调用不可访问的方法时触发
  • __get()用于从不可访问的属性读取数据
  • __set()用于将数据写入不可访问的属性
  • __isset()在不可访问的属性上调用isset()或empty()触发
  • __unset()在不可访问的属性上使用unset()时触发
对象被销毁的时机:php程序运行结束,或者没有任何变量指向它。 > > 学习链接
__sleep(), __wakeup() serialize()序列化时,检查类是否有sleep()函数,有则第一个执行。sleep()的预期用途是提交挂起的数据或执行类似的清理任务。
unserialize()被调用时,首先检查wakeup()函数的存在,若存在则调用。该功能可重构对象具有的任何资源。wakeup()的预期用途是重新建立在序列化期间可能已丢失的任何数据库连接,并执行其他重新初始化任务。
利用
举例:
正常程序逻辑是不会触及class2的,但可以通过反序列化来构造:
< ?php class vulclass { var $test; function __construct() { $this-> test = new class1(); } function __destruct() { $this-> test-> action(); }}class class1 { function action() { echo " class1" ; }}class class2 { var $test2; function action() { eval($this-> test2); }}$c = new vulcalss(); unserialize($_GET[' test' ]); ?>

可以构造这样的对象,传入参数后就可以执行漏洞函数:
< ?php class vulclass { var $test; function __construct() { $this-> test = new ph0en2x(); } } class ph0en2x { var $test2 = " phpinfo(); " ; } echo serialize(new chybeta()); ?>

很好的文章
第一个
第二个
Bypass
绕过正则匹配 【PHP漏洞总结】增加一个+号
场景来源:
if (isset($_GET[' var' ])) { $var = base64_decode($_GET[' var' ]); if (preg_match(' /[oc]:\d+:/i' , $var)) { die(' stop hacking!' ); } else { @unserialize($var); }

这个正则表达式检测开头为o或c,接下来是冒号,然后是数字的模式,忽略大小写。使用如下方式可以绕过:O:+4:" Demo" :2:{s:10:" Demofile" ; s:8:" fl4g.php" ; }
经过尝试,注意:加号只能在冒号后面添加,其他地方不可以。
具体绕过原理不明。
绕过__wakeup()函数 ()自定义反序列化字符串,给出的变量个数小于你定义的个数,就会绕过。 一个实例
Auto Loading unserialize() 函数只能反序列化在当前程序上下文中已经被定义过的类,传统编程需要很多include和require,后来出现了autooading技术,自动导入使用的类。
还有一个东西要提一下,那就是Composer,这是一个php的包管理工具,同时他还能自动导入所以依赖库中定义的类。这样一来 unserialize() 函数也就能使用所有依赖库中的类了,攻击面又增大不少。
  1. Composer配置的依赖库存储在vendor目录下
  2. 如果要使用Composer的自动类加载机制,只需要在php文件的开头加上 require DIR . '/vendor/autoload.php';
漏洞函数 strcmp
在两个字符串相等的时候返回0,该函数不能处理数组,如果传入了数组参数会返回NULL。
根据之前的类型比较,如果比较时使用了strcmp(a,b) == 0,那么(NULL == 0)是true,所以传入数组可以绕过该函数。
防御方法是使用 === 进行严格比较。
in_array和array_search
函数原型:
bool in_array ( mixed $needle , array $haystack [, bool $strict = FALSE ] )
如果strict参数没有提供,in_array就使用==判断$needle是否在$haystack中。
当strict的值为true时,in_array()会比较needls的类型和haystack中的类型是否相同。
$array=[0,1,2,' 3' ]; var_dump(in_array(' abc' , $array)); //true var_dump(in_array(' 1bc' , $array)); //true

switch语句
如果switch是数字类型的case的判断时,switch会将其中的参数转换为int类型。
$i =" 1abc" ; switch ($i) { case 0: case 1: echo " i is less than 2 but not negative" ; break; case 2: echo " i is 2" ; }

会输出 i is less than 2 but not negative
is_numeric
md5
  • md5(数组)会返回 null (Warning级别)
Warning: md5() expects parameter 1 to be string, array given in /main.php on line 7
  • 0e开头碰撞:根据比较机制的缺陷,使md5值都是0e开头,即可绕过md5(a) == md5(b)这样的条件判断。
示例
0e644c2d05e6d81ff04194145d497c74 1aaabw 0e93fcef5a44bbc455bb54011b8c6b2f 2aaady 0edfb3f3a9ab8d5ae227861e9a44b3e7 3aaacO 0eabd2eeb3b01d5b516a4e5bc51d6a43 4aaaci 0e1e066173172fd0eb55ac92ee4d9254 5aaabd 0e98a9e89b8bf419701c85ec8183247c 6aaabp 0e17990dcefa714d524be3fcab79491c 7aaaad 0e5a9f50d8369a2bbbab1797752111f1 8aaalf 0e2eb438bed241fdb0f6fa0d93ac86c5 9aaaaE

python脚本
import hashlibts = " tsctf" #想要开头的字符串 cs = " abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" def check(plx): m = hashlib.md5() t = m.update((ts+plx).encode(" utf-8" )).hexdigest() if t.startswith(" 0e" ): print(m+" : " m.hexdigest()) return True else: return False# 找不到的话也可以多几个循环嵌套 for x in cs: for y in cs: if check(x+y): print(ts+x+y) break

  • md5碰撞:使用fastcoll工具。https://github.com/upbit/clone-fastcoll
%00截断
php版本小于等于5.2.9和magic_quotes_gpc关闭,两个条件都必须满足才能截断。
影响的函数
  • include,include_once,require,require_once
  • file_exists
  • ereg,eregi(正则表达式匹配)
  • file_get_contents
不处理截断的函数
  • strlen

    推荐阅读