辛星2018年nio教程第四篇:ByteBuffer的加速技术

先打个小广告,关注辛星教程,我的微信号xinxing0913,该项目源码所在的github地址: https://github.com/xinxing0913/xinxing-nio-guide。
在nio里面,我们的主要操作对象就是文件和网络,第四篇内容还是会介绍文件操作,从第五篇开始我们将重心放在网络部分。可能很多童鞋在日常工作中主要是操作数据库和缓存,并不怎么操作文件,所以可能对文件的处理不太感兴趣。但是不得不说,文件的处理仍然在基础架构中扮演者非常重要的角色,如果我们要做文件存储服务,或者日志分析,或者文件的加密解密转码等操作时,都离不开对文件的处理。
随着人们对文件处理性能的需要,也催生出了很多加速io的技术,内存映射就是其中的一种技术,在linux下有C或者C++编程经验的朋友们,应该会知道有mmap()、munmap()等一系列的操作,它可以把页面映射到进程的地址空间,从而提升io操作的性能。
【辛星2018年nio教程第四篇:ByteBuffer的加速技术】对于底层原理,这里不进行展开,感兴趣的朋友们可以查阅相关文档,这里我们重点还是聚焦在应用层面。对于这种技术,Java提供了自己的封装,也就是我们今天要介绍的MappedByteBuffer。
对于它的获取,我们可以从FileChannel的map()方法中获取,它需要三个参数,分别是:

  • mode,也就是映射模式,我们有三种模式可选,分别是FileChannel.MapMode.READ_ONLY(即只读模式)、FileChannel.MapMode.READ_WRITE(即读写模式)、FileChannel.MapMode.PRIVATE(即私有模式)。
  • position,即从channel开始映射的起始位置,单位是字节数。
  • size,即映射的字节数。
由于面向对象的封装特性,所以我们可以使用MappedByteBuffer来进行文件的拷贝吧,这里我选择拷贝一个pdf文件,大小大约是37MB,我们代码内容如下:
package com.mengzhidu.nio.demo; import java.io.RandomAccessFile; import java.nio.MappedByteBuffer; import java.nio.channels.FileChannel; /** * 通过MappedByteBuffer来读取文件 * 我们这里读取的文件相对较大一些,大约是37MB * 这里朋友们在进行测试的时候,需要修改对应的文件为自己的文件 */ public class Demo6 { public static void main(String[] args) throws Exception{ String readPath = "/Users/xinguimeng/file/test.pdf"; String writePath = "/Users/xinguimeng/file/test2.pdf"; FileChannel readChannel = new RandomAccessFile(readPath, "r").getChannel(); FileChannel writeChannel = new RandomAccessFile(writePath, "rw").getChannel(); // 我们这里每次复制2MB long length = 2097152; // 剩余大小的初始值为文件大小 long remain = readChannel.size(); while (remain > 0) { // 如果不足2MB,则使用剩下的字节大小 if (remain < length) { length = remain; } System.out.println("还剩字节大小:" + remain); // 获取内存映射的缓冲区 MappedByteBuffer buffer = readChannel.map(FileChannel.MapMode.READ_ONLY, readChannel.position(), length); // 把数据写入缓冲区 writeChannel.write(buffer); // 重新设置position的位置 readChannel.position(readChannel.position() + length); // 重新设置remain的大小 remain =readChannel.size() -readChannel.position(); } System.out.println("文件复制完成"); // 关闭读写通道 readChannel.close(); writeChannel.close(); } }

在执行上述代码后,我们就会看到如下执行结果:
还剩字节大小:47030003 还剩字节大小:44932851 还剩字节大小:42835699 还剩字节大小:40738547 ... 省略一些中间数据... 还剩字节大小:7184115 还剩字节大小:5086963 还剩字节大小:2989811 还剩字节大小:892659 文件复制完成

在拷贝完成后,我们可以打开我们的pdf,发现是没有问题的,至此,我们用内存映射的方式来拷贝文件完毕。
关于缓冲区的加速技术,另一个经常拿来做对比的就是HeapByteBuffer和DirectByteBuffer,一个是在堆上分配内存,一个是在堆外分配内存。虽然出于性能的考虑,在堆外分配内存确实会提升性能,但是使用不当会造成很难处理的bug,因此jdk并没有直接把这两个类作成public的,而是包级别的,jdk官方并不想让我们太依赖它们。不过我们在创建缓冲区的时候,我们可以使用ByteBuffer.allocateDirect()方法来分配堆外内存,不过我们之前一直都是使用的ByteBuffer.allocate()方法来分配的堆内内存。

    推荐阅读