FastJson稍微使用不当就会导致StackOverflow

toutiao

7年之前

FastJson稍微使用不当就会导致StackOverflow

对于广大的开发人员来说，FastJson大家一定都不陌生。

FastJson（https://github.com/alibaba/fastjson）是阿里巴巴的开源JSON解析库，它可以解析JSON格式的字符串，支持将Java Bean序列化为JSON字符串，也可以从JSON字符串反序列化到JavaBean。

可以看到，运行以上测试代码后，代码执行时，抛出了StackOverflow。

从以上截图中异常的堆栈我们可以看到，主要是在执行到BuyerInfo的getJsonString方法后导致的。

那么，为什么会发生这样的问题呢？这就和FastJson的实现原理有关了。

FastJson的实现原理

关于序列化和反序列化的基础知识大家可以参考Java对象的序列化与反序列化，这里不再赘述。

FastJson的序列化过程，就是把一个内存中的Java Bean转换成JSON字符串，得到字符串之后就可以通过数据库等方式进行持久化了。

那么，FastJson是如何把一个Java Bean转换成字符串的呢，一个Java Bean中有很多属性和方法，哪些属性要保留，哪些要剔除呢，到底遵循什么样的原则呢？

其实，对于JSON框架来说，想要把一个Java对象转换成字符串，可以有两种选择：

1、基于属性。
2、基于setter/getter

关于Java Bean中的getter/setter方法的定义其实是有明确的规定的，参考JavaBeans(TM) Specification

而我们所常用的JSON序列化框架中，FastJson和jackson在把对象序列化成json字符串的时候，是通过遍历出该类中的所有getter方法进行的。Gson并不是这么做的，他是通过反射遍历该类中的所有属性，并把其值序列化成json。

不同的框架进行不同的选择是有着不同的思考的，这个大家如果感兴趣，后续文字可以专门介绍下。

那么，我们接下来深入一下源码，验证下到底是不是这么回事。

分析问题的时候，最好的办法就是沿着异常的堆栈信息，一点点看下去。我们再来回头看看之前异常的堆栈：

之所以使用ASM技术，主要是FastJson想通过动态生成类来避免重复执行时的反射开销。但是，在FastJson中，两种序列化实现是并存的，并不是所有情况都需要通过ASM生成一个动态类。读者可以尝试将BuyerInfo作为一个内部类，重新运行以上Demo，再看异常堆栈，就会发现JavaBeanSerizlier的身影。

那么，既然是因为出现了循环调用导致了StackOverflowError，我们接下来就将重点放在为什么会出现循环调用上。

JavaBeanSerizlier序列化原理

我们已经知道，在FastJson序列化的过程中，会使用JavaBeanSerizlier进行，那么就来看下 JavaBeanSerizlier到底做了什么，他是如何帮助FastJson进行序列化的。

FastJson在序列化的过程中，会调用JavaBeanSerizlier的write方法进行，我们看一下这个方法的内容：

以上代码，我们省略了大部分代码之后，可以看到逻辑相对简单：就是先获取要序列化的对象的所有getter方法，然后遍历方法进行执行，视图通过getter方法获得对应的属性的值。

但是，当调用到我们定义的getJsonString方法的时候，进而会调用到JSON.toJSONString(this)，就会再次调用到JavaBeanSerizlier的write。如此往复，形成死循环，进而发生StackOverflowError。

所以，如果你定义了一个Java对象，定一个了一个getXXX方法，并且在该方法中调用了JSON.toJSONString方法，那么就会发生StackOverflowError！

如何避免StackOverflowError

通过查看FastJson的源码，我们已经基本定位到问题了，那么如何避免这个问题呢？

还是从源码入手，既然JavaBeanSerizlier的write方法会尝试获取对象的所有getter方法，那么我们就来看下他到底是怎么获取getter方法的，到底哪些方法会被他识别为”getter”，然后我们再对症下药。

在JavaBeanSerizlier的write方法中，getters的获取方式如下：

可见，无论是this.sortedGetters还是this.getters，都是JavaBeanSerizlier中的属性，那么就继续往上找，看看JavaBeanSerizlier是如何被初始化的。

通过调用栈追根溯源，我们可以发现，JavaBeanSerizlier是在SerializeConfig的成员变量serializers中获取到的，那么继续深入，就要看SerializeConfig是如何被初始化的，即BuyerInfo对应的JavaBeanSerizlier是如何被塞进serializers的。

通过调用关系，我们发现，SerializeConfig.serializers是通过SerializeConfig.putInternal方法塞值的：

那么，通过上图，我们可以看到computeGetters方法在过滤getter方法的时候，是有一定的逻辑的，只要我们想办法利用这些逻辑，就可以避免发生StackOverflowError。

这里要提一句，下面将要介绍的几种方法，都是想办法使目标方法不参与序列化的，所以要特别注意下。但是话又说回来，谁会让一个JavaBean的toJSONString进行序列化呢？

1、修改方法名

首先我们可以通过修改方法名的方式解决这个问题，我们把getJsonString方法的名字改一下，只要不以get开头就可以了，如改为toJsonString。

2、使用JSONField注解

除了修改方法名以外，FastJson还提供了两个注解可以让我们使用，首先介绍JSONField注解，这个注解可以作用在方法上，如果其参数serialize设置成false，那么这个方法就不会被识别为getter方法，就不会参加序列化。

3、使用JSONType注解

FastJson还提供了另外一个注解——JSONType，这个注解用于修饰类，可以指定ignores和includes。如下面的例子，如果使用@JSONType(ignores = “jsonString”)定义BuyerInfo，则也可避免StackOverflowError。

总结

FastJson是使用非常广泛的序列化框架，可以在JSON字符串和Java Bean之间进行互相转换。

但是在使用时要尤其注意，不要在Java Bean的getXXX方法中调用JSON.toJSONString方法，否则会导致StackOverflowError。

原因是因为FastJson在序列化的时候，会根据一系列规则获取一个对象中的所有getter方法，然后依次执行。

如果一定要定义一个方法，调用JSON.toJSONString的话，想要避免这个问题，可以采用以下方法：

1、方法名不以get开头
2、使用@JSONField(serialize = false)修饰目标方法
3、使用@JSONType修饰该Bean，并ignore掉方法对应的属性名（getXxx -> xxx）

最后，作者之所以写这篇文章，是因为在工作中真的实实在在的碰到了这个问题。

发生问题的时候，我立刻想到改个方法名，把getJsonString改成了toJsonString解决了这个问题。因为我之前看到过关于FastJson的简单原理。

后来想着，既然FastJson设计成通过getter来进行序列化，那么他一定提供了一个口子，让开发者可以指定某些以get开头的方法不参与序列化。

第一时间想到一般这种口子都是通过注解来实现的，于是打开FastJson的源代码，找到了对应的注解。

然后，趁着周末的时间，好好的翻了一下FastJson的源代码，彻底弄清楚了其底层的真正原理。

以上就是我发现问题——>分析问题——>解决问题——>问题的升华的全过程，希望对你有帮助。

通过这件事，笔者悟出了一个道理：

看过了太多的开发规范，却依然还是会写BUG！

希望通过这样一篇小文章，可以让你对这个问题有个基本的印象。

现在，他是新的世界首富 »

« 18岁出道爆红，34岁未婚先孕，孩子生父至今是谜，今母子相依为命