Java 8 Lambda实现原理分析

PDF文档已上传Github
Github:https://github.com/zwjlpeng/Angrily_Learn_Java_8
为了支持函数式编程,Java 8引入了Lambda表达式,那么在Java 8中到底是如何实现Lambda表达式的呢? Lambda表达式经过编译之后,到底会生成什么东西呢? 在没有深入分析前,让我们先想一想,Java 8中每一个Lambda表达式必须有一个函数式接口与之对应,函数式接口与普通接口的区别,可以参考前面的内容,那么你或许在想Lambda表达式是不是转化成与之对应的函数式接口的一个实现类呢,然后通过多态的方式调用子类的实现呢,如下面代码是一个Lambda表达式的样例

@FunctionalInterface interface Print { public void print(T x); } public class Lambda { public static void PrintString(String s, Print print) { print.print(s); } public static void main(String[] args) { PrintString("test", (x) -> System.out.println(x)); } }

按照上面的分析,理论上经过编译器处理后,最终生成的代码应该如下面所示:
@FunctionalInterface interface Print { public void print(T x); }class Lambda$$0 implements Print { @Override public void print(String x) { System.out.println(x); } }public class Lambda { public static void PrintString(String s, Print print) { print.print(s); } public static void main(String[] args) { PrintString("test", new Lambda$$0()); } }

再或者是一个内部类实现,代码如下所示:
@FunctionalInterface interface Print { public void print(T x); } public class Lambda { final class Lambda$$0 implements Print { @Override public void print(String x) { System.out.println(x); } } public static void PrintString(String s, Print print) { print.print(s); } public static void main(String[] args) { PrintString("test", new Lambda().new Lambda$$0()); } }

异或是这种匿名内部类实现,代码如下所示:
@FunctionalInterface interface Print { public void print(T x); } public class Lambda { public static void PrintString(String s, Print print) { print.print(s); } public static void main(String[] args) { PrintString("test", new Print() { @Override public void print(String x) { System.out.println(x); } }); } }

上面的代码,除了在代码长度上长了点外,与用Lambda表达式实现的代码运行结果是一样的,那么Java 8到底是用什么方式实现的呢? 是不是上面三种实现方式中的一种呢,你也许觉的自已想的是对的,其实本来也就是对的,在Java 8中采用的是内部类来实现Lambda表达式
那么Lambda表达式到底是如何实现的呢?
为了探究Lambda表达式是如何实现的,就得需要研究Lambda表过式最终转化成的字节码文件,这就需要jdk的bin目录下的一个字节码查看工具及反编译工具
javap -p Lambda.class
上面命令中的-p表示输出所有类及成员,运行上面的命令后,得的结果如下所示:
Compiled from "Lambda.java" public class Lambda { public Lambda(); public static void PrintString(java.lang.String, Print); public static void main(java.lang.String[]); private static void lambda$0(java.lang.String); }

由上面的代码可以看出编译器会根据Lambda表达式生成一个私有的静态函数,注意,在这里说的是生成,而不是等价
private static void lambda$0(java.lang.String);
为了验证上面的转化是否正确? 我们在代码中定义一个lambda$0这个的函数,最终代码如下所示:
@FunctionalInterface interface Print { public void print(T x); }public class Lambda { public static void PrintString(String s, Print print) { print.print(s); } private static void lambda$0(String s) { } public static void main(String[] args) { PrintString("test", (x) -> System.out.println(x)); } }

上面的代码在编译时不会报错,但是运行时就会报错,因为存在两个lambda$0函数,如下所示,是运行时的错误
Exception in thread "main" java.lang.ClassFormatError: Duplicate method name&signature in class file Lambda at java.lang.ClassLoader.defineClass1(Native Method) at java.lang.ClassLoader.defineClass(ClassLoader.java:760) at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142) at java.net.URLClassLoader.defineClass(URLClassLoader.java:467) at java.net.URLClassLoader.access$100(URLClassLoader.java:73) at java.net.URLClassLoader$1.run(URLClassLoader.java:368) at java.net.URLClassLoader$1.run(URLClassLoader.java:362) at java.security.AccessController.doPrivileged(Native Method) at java.net.URLClassLoader.findClass(URLClassLoader.java:361) at java.lang.ClassLoader.loadClass(ClassLoader.java:424) at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331) at java.lang.ClassLoader.loadClass(ClassLoader.java:357) at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:495)

通过javap对上述错误代码进行反编译,反编译之后输出的类的成员如下所示
Compiled from "Lambda.java" public class Lambda { public Lambda(); public static void PrintString(java.lang.String, Print); private static void lambda$0(java.lang.String); public static void main(java.lang.String[]); private static void lambda$0(java.lang.String); }

会发现lambda$0出现了两次,那么在代码运行的时候,就不知道去调用哪个,因此就会抛错。
有了上面的内容,可以知道的是Lambda表达式在Java 8中首先会生成一个私有的静态函数,这个私有的静态函数干的就是Lambda表达式里面的内容,因此上面的代码初步可以转化成如下所示的代码
@FunctionalInterface interface Print { public void print(T x); } public class Lambda { public static void PrintString(String s, Print print) { print.print(s); }private static void lambda$0(String x) { System.out.println(x); }public static void main(String[] args) { PrintString("test", /**lambda expression**/); } }

转化成上面的形式之后,那么如何实现调用静态的lambda$0函数呢,在这里可以在以下方法打上断点,可以发现在有lambda表达式的地方,运行时会进入这个函数
public static CallSite metafactory(MethodHandles.Lookup caller, String invokedName, MethodType invokedType, MethodType samMethodType, MethodHandle implMethod, MethodType instantiatedMethodType) throws LambdaConversionException { AbstractValidatingLambdaMetafactory mf; mf = new InnerClassLambdaMetafactory(caller, invokedType, invokedName, samMethodType, implMethod, instantiatedMethodType, false, EMPTY_CLASS_ARRAY, EMPTY_MT_ARRAY); mf.validateMetafactoryArgs(); return mf.buildCallSite(); }

在这个函数中可以发现为Lambda表达式生成了一个内部类,为了验证是否生成内部类,可以在运行时加上-Djdk.internal.lambda.dumpProxyClasses,加上这个参数后,运行时,会将生成的内部类class码输出到一个文件中
final class Lambda$$Lambda$1 implements Print { private Lambda$$Lambda$1(); public void print(java.lang.Object); }

如果运行javap -c -p 则结果如下
复制代码
final class Lambda$$Lambda$1 implements Print { private Lambda$$Lambda$1(); Code: 0: aload_0 1: invokespecial #10// Method java/lang/Object."":()V 4: returnpublic void print(java.lang.Object); Code: 0: aload_1 1: checkcast#14// class java/lang/String 4: invokestatic#20// Method Lambda.lambda$0:(Ljava/lang/String; )V 7: return }

通过上面的字节码指令可以发现实现上调用的是Lambda.lambda$0这个私有的静态方法
【Java 8 Lambda实现原理分析】因此最终的Lambda表达式等价于以下形式
@FunctionalInterface interface Print { public void print(T x); } public class Lambda { public static void PrintString(String s, Print print) { print.print(s); } private static void lambda$0(String x) { System.out.println(x); } final class $Lambda$1 implements Print{ @Override public void print(Object x) { lambda$0((String)x); } } public static void main(String[] args) { PrintString("test", new Lambda().new $Lambda$1()); } }

    推荐阅读