android 内存泄漏问题

逆水行舟用力撑,一篙松劲退千寻。这篇文章主要讲述android 内存泄漏问题相关的知识,希望能为你提供帮助。
本文转载自:http://www.voidcn.com/article/p-hbnuyfwz-ee.html
内存泄露问题在一些压力测试的场景很容易暴露,例如一些常用应用场景反复操作(eg:反复切换前后摄像头,反复进入退出相机应用、压力拍照等等)。
内存泄露一般表现为:
①内存分配释放,导致进程空间虚拟地址被分配完,或者物理地址被分配完。
②文件泄露,导致进程空间文件句柄数达到最大值。
③线程泄露,导致进程空间虚拟地址被分配完,进程内保留很多线程栈(stack)。
 
 
android Native层中大部分的泄露问题都在HAL层,主要导致原因就是一些非对称操作。
1. 工具
 
这一层主要使用工具为Linux自带的工具以及一些文件节点的状态。
命令列表:

ps  [-t] [pid] [ | busybox wc -l ]
top [-t]
ll /proc/pid/fd [ |busybox wc -l ]
cat /proc/pid/maps [ |busybox wc -l ]
cat /proc/meminfo [ | grep "MemFree" ]
dumpsys meminfo [ pid ] [ package name ]
procrank  valgrind
valgrind
 
 
2.  ps / top命令
 
ps /top 可以对linux系统中进程进行监测和控制。Ps 是显示瞬间进程的状态;Top是对进程运行时间监控。
Ps/top命令查找到目标的进程号pid,再根据pid去观测反复操作中Ps/top的两项打印项:
VSIZE(VSS)  :占用的虚拟内存的大小。
RSS  :占用内存的大小。
确认下这两项是否一直在无限制增大,这样子可以初步确认一下内存泄露问题的存在性。
ps -t pid 这个命令可以列出当前进程所有线程,包括native线程和java线程。
native线程可以查看到其线程名,如:
USER        PID    PPID  VSIZE  RSS        WCHAN      PC                NAME
media        1574  1465      50312  9992    c0089920    b6ea491c SCameraCaptureTh
 
Java 线程只能看到java线程在native层的映射名
USER        PID    PPID  VSIZE  RSS  WCHAN    PC            NAME
u0_a22      6884  2562  984204 54004 c0089920  4010491c SThread-194
 
查线程是否泄露技巧:可以在相同的状态反复使用下面命令,如在每次应用打开关闭后使用,这个命令可以统计目标进程内所有的线程数,这个数一直在增加的话,说明进程内存在进程内有线程没有正常被释放。
ps -t pid | busybox wc -c
 
 
3.  proc进程状态节点 
 
Linux proc虚拟文件系统中会记载系统所有进程的一些状态信息,在/prco下会有进程目录,目录名就是pid。pid文件夹下信息量非常庞大,现在只介绍两个与查内泄漏相关的:fd目录和maps节点。
[email  protected]:/ # ps mediaserver
USER        PID    PPID  VSIZE  RSS    WCHAN      PC                NAME
media        8403   1        240688    16940  ffffffff  b6f225a0 S /system/bin/mediaserver
[email  protected]:/ # ll /proc/8403
 
dr-xr-xr-x media      audio                        2012-02-14 12:55 attr
.......................................
dr-x------ media      audio                        2012-02-14 12:55 fd
-r--r--r-- media        audio                    0 2012-02-14 12:55 maps
.......................................
-r--r--r-- media      audio                    0 2012-02-14 12:55 wchan
【android 内存泄漏问题】 
①进程fd目录
可以看出fd目下为文件句柄的链接,例如17为文件句柄号,/system/etc/camera.cfg为打开的文件目录。
[email  protected]:/ # ll /proc/8403/fd
 
lrwx------ media      audio                        2012-02-14 13:02 0 -> /dev/null
lrwx------ media      audio                        2012-02-14 13:02 1 -> /dev/null
l-wx------ media      audio                        2012-02-14 13:02 10 -> /dev/log/system
lr-x------ media      audio                        2012-02-14 13:02 11 -> /dev/__properties__
lr-x------ media      audio                        2012-02-14 13:02 16 -> /system/etc/camera.cfg
lr-x------ media      audio                        2012-02-14 13:0217  ->   /system/etc/camera.cfg
l-wx------ media      audio                        2012-02-14 13:02 18 -> /dev/cpuctl/apps/tasks
lrwx------ media      audio                        2012-02-14 13:02 3 -> /dev/binder
lrwx------ media      audio                        2012-02-14 13:02 8 -> /dev/cpuctl/tasks
l-wx------ media      audio                        2012-02-14 13:02 9 -> /dev/log/events
.......................................
 
查看系统每个线程的文件句柄最大值,一般系统都会默认一个进程最多有1024个文件句柄,当一个进程打开文件句柄的数量达到1024时,再次创建文件句柄会失败,strerror(errno)会报出“ Too many open files” 。
cat /proc/pid/limits  |  grep "Max open files"
 
查文件句柄是否泄露技巧:可以在相同的状态反复使用下面命令,如在每次应用打开关闭后使用,这个命令可以统计目标进程内所有文件句柄,这个数一直在增加的话,说明进程内存在进程内有文件句柄没有正常被关闭。
cat /proc/fd | busybox wc -c
 
②进程maps节点
Maps节点可以查询进程的虚内存空间的使用情况。
 
该文件有6列,分别为:
地址:库在进程里地址范围
权限:虚拟内存的权限,r=读,w=写,x=,s=共享,p=私有;
偏移量:库在进程里地址范围
设备:映像文件的主设备号和次设备号;
节点:映像文件的节点号;
路径: 映像文件的路径
[email  protected]:/ # cat /proc/8403/maps
 
a9035000-a9525000 rw-s 98bb3000 00:09 2159            anon_inode:dmabuf
................................................................
a95bf000-a96bc000 rw-p 00000000 00:00 0                  [stack:11334]
a99fc000-ab17b000 rw-s 96354000 00:0c 31508          /dev/video0
ab17b000-ac8fa000 rw-s 94bd5000 00:0c 31508          /dev/video0
af7f8000-b0f77000 rw-s 90558000 00:0c 31508          /dev/video0
b0f77000-b26f6000 rw-s 8edd9000 00:0c 31508          /dev/video0
................................................................
 
b26f9000-b27f6000 rw-p 00000000 00:00 0                  [stack:11307]
b27f6000-b27f8000 rw-p 00000000 00:00 0
................................................................
b4bb4000-b4bb5000 r--p 00001000 b3:07 1091            /system/lib/libril_audio.so
b4bb5000-b4bb6000 rw-p 00002000 b3:07 1091            /system/lib/libril_audio.so
..................................................................
b6f54000-b6f55000 r--p 0000f000 b3:07 149              /system/bin/linker
b6f55000-b6f56000 rw-p 00010000 b3:07 149              /system/bin/linker
b6f56000-b6f57000 rw-p 00000000 00:00 0
b6f57000-b6f59000 r-xp 00000000 b3:07 162              /system/bin/mediaserver
b6f5a000-b6f5b000 r--p 00002000 b3:07 162              /system/bin/mediaserver
b6f5b000-b6f5c000 rw-p 00000000 00:00 0
b852b000-b859d000 rw-p 00000000 00:00 0                  [heap]
bea7c000-bea9d000 rw-p 00000000 00:00 0                  [stack]
ffff0000-ffff1000 r-xp 00000000 00:00 0                  [vectors]
 
 
32位Liunx系统每个进程有4G地址空间,android系统下进程地址空间分部如下:
                                                                                                                                                                                                                     
高位1G空间为内核地址空间,地位3G空间为用户地址空间,可以看出栈stack是有高位向低位增长,而堆heap是由地位向高位增长,还有一段加载动态库的段,可以根据上面的catmaps打印出来对比。
堆泄露的定位方法:
下面是调用mmap映射得到进程虚拟地址,这样的打印持续增多的话,说明进程中有mmap 和 munmap没有对称操作,导致进程虚拟地址的泄露。
ab17b000-ac8fa000 rw-s 94bd5000 00:0c 31508          /dev/video0
 
下面是一个线程栈的使用情况, [stack:11334],11334为线程号tid,这样的打印持续增多的话,说明进程中会持续创建线程,但是没有释放旧线程。
a95bf000-a96bc000 rw-p 00000000 00:00 0                  [stack:11334]
 
 
③meminfo节点
proc/meminfo节点记录了系统内存的一些使用情况,主要看MemFree这项。
[email  protected]:/ # cat /proc/meminfo
cat /proc/meminfo
MemTotal:              1673008 kB所有可用RAM大小(即物理内存减去一些预留位和内核的二进制代码大小)
MemFree:                  761320 kB  LowFree与HighFree的总和,被系统留着未使用的内存
..........................................
Mapped:                      87932 kB 设备和文件等映射的大小。
..........................................
 
 
4.  Android 工具
 
这是Android上实现的一些命令,在Native这层也可以使用,但是统计的一些信息也和上面的一样。
①dumpsys meminfo [ pid ] [ package name]
可以查看到某个线程(包括应用应用和系统线程)内存使用情况,包括Native堆和java堆。一般用来查java应用的进程,对于系统Native进程,dump出来信息较少。
 
②procrank
Androidprocrank  (/system/xbin/procrank) 工具,能够列出进程所占用的内存使用情况。顺序为从高到低。每个进程占用内存大小以 VSS,  RSS , PSS, USS 的形式列出。为了简化描述,内存占用以页为单位表述,而不是字节。 通常每页为 4096 字节。(和ps功能差不多,数据有少许差异)。
 
③valgrind
android sdk默认集成了valgrind,一款优秀的内存问题检测工具,能够发现内存泄漏。
当前的方案默认没有编译该工具,可以通过以下命令临时编译:
$ cd external/valgrind
$ mm -j16
然后回到android根目录编译生产system.img。对于系统启动运行的进程需要,如debug surfaceflinger,需要在init.rc注释surfaceflinger service,改为命令行启动,
[email  protected]:/ # valgrind --leak-check=full --log-file=/data/valgrind.log /system/bin/surfaceflinger &
 
进行界面的一些简单操作后将surfacelinger进程kill掉,valgrind即会将分析报告输出到/data/valgrind.log,里面信息很多,附上相关的范例log:
 
关注leak summary:
 
==1982== LEAK SUMMARY:
==1982==      definitely lost: 58,004 bytes in 477 blocks
==1982==      indirectly lost: 376 bytes in 8 blocks
==1982==          possibly lost: 122,997 bytes in 484 blocks
==1982==      still reachable: 922,973 bytes in 20,141 blocks
==1982==                suppressed: 0 bytes in 0 blocks
==1982== Reachable blocks (those to which a pointer was found) are not shown.
==1982== To see them, rerun with: --leak-check=full --show-reachable=yes
==1982==
==1982== For counts of detected and suppressed errors, rerun with: -v
==1982== Use --track-origins=yes to see where uninitialised values come from
==1982== ERROR SUMMARY: 673822 errors from 827 contexts (suppressed: 0 from 0)
 
 

    推荐阅读