阿粉昨天说我动不动就内存泄漏,我好委屈...

存储 存储软件
大家好,我是 ThreadLocal ,昨天阿粉说我动不动就内存泄漏,我蛮委屈的,我才没有冤枉他嘞,证据在这里: ThreadLocal 你怎么动不动就内存泄漏?

[[341667]]

 大家好,我是 ThreadLocal ,昨天阿粉说我动不动就内存泄漏,我蛮委屈的,我才没有冤枉他嘞,证据在这里: ThreadLocal 你怎么动不动就内存泄漏?

因为人家明明也考虑到了很多情况,做了很多事情,保证了如果没有 remove ,也有对 key 值为 null 时进行回收的处理操作

啥?你竟然不信?我 ThreadLocal 难道会骗你么

今天为了证明一下自己,我打算从组成的源码开始讲起,在 get , set 方法中都有对 key 值为 null 时进行回收的处理操作,先来看 set 方法是怎么做的

set

下面是 set 方法的源码:

  1. private void set(ThreadLocal<?> key, Object value) { 
  2.  
  3.     // We don't use a fast path as with get() because it is at 
  4.     // least as common to use set() to create new entries as 
  5.     // it is to replace existing ones, in which case, a fast 
  6.     // path would fail more often than not
  7.  
  8.     Entry[] tab = table
  9.     int len = tab.length; 
  10.     int i = key.threadLocalHashCode & (len-1); 
  11.  
  12.     for (Entry e = tab[i]; 
  13.         // 如果 e 不为空,说明 hash 冲突,需要向后查找 
  14.         e != null
  15.         // 从这里可以看出, ThreadLocalMap 采用的是开放地址法解决的 hash 冲突 
  16.         // 是最经典的 线性探测法 --> 我觉得之所以选择这种方法解决冲突时因为数据量不大 
  17.         e = tab[i = nextIndex(i, len)]) { 
  18.         ThreadLocal<?> k = e.get(); 
  19.  
  20.         // 要查找的 ThreadLocal 对象找到了,直接设置需要设置的值,然后 return 
  21.         if (k == key) { 
  22.             e.value = value; 
  23.             return
  24.         } 
  25.  
  26.         // 如果 k 为 null ,说明有 value 没有及时回收,此时通过 replaceStaleEntry 进行处理 
  27.         // replaceStaleEntry 具体内容等下分析 
  28.         if (k == null) { 
  29.             replaceStaleEntry(key, value, i); 
  30.             return
  31.         } 
  32.     } 
  33.  
  34.     // 如果 tab[i] == null ,则直接创建新的 entry 即可 
  35.     tab[i] = new Entry(key, value); 
  36.     int sz = ++size
  37.     // 在创建之后调用 cleanSomeSlots 方法检查是否有 value 值没有及时回收 
  38.     // 如果 sz >= threshold ,则需要扩容,重新 hash 即, rehash(); 
  39.     if (!cleanSomeSlots(i, sz) && sz >= threshold) 
  40.         rehash(); 

通过源码可以看到,在 set 方法中,主要是通过 replaceStaleEntry 方法和 cleanSomeSlots 方法去做的检测和处理

接下来瞅瞅 replaceStaleEntry 都干了点儿啥

replaceStaleEntry

  1. private void replaceStaleEntry(ThreadLocal<?> key, Object value, 
  2.                                 int staleSlot) { 
  3.     Entry[] tab = table
  4.     int len = tab.length; 
  5.     Entry e; 
  6.  
  7.     // 从当前 staleSlot 位置开始向前遍历 
  8.     int slotToExpunge = staleSlot; 
  9.     for (int i = prevIndex(staleSlot, len); 
  10.         (e = tab[i]) != null
  11.         i = prevIndex(i, len)) 
  12.         if (e.get() == null
  13.             // 当 e.get() == null 时, slotToExpunge 记录下此时的 i 值 
  14.             // 即 slotToExpunge 记录的是 staleSlot 左手边第一个空的 Entry 
  15.             slotToExpunge = i; 
  16.  
  17.     // 接下来从当前 staleSlot 位置向后遍历 
  18.     // 这两个遍历是为了清理在左边遇到的第一个空的 entry 到右边的第一个空的 entry 之间所有过期的对象 
  19.     // 但是如果在向后遍历过程中,找到了需要设置值的 key ,就开始清理,不会再继续向下遍历 
  20.     for (int i = nextIndex(staleSlot, len); 
  21.         (e = tab[i]) != null
  22.         i = nextIndex(i, len)) { 
  23.         ThreadLocal<?> k = e.get(); 
  24.  
  25.         // 如果 k == key 说明在插入之前就已经有相同的 key 值存在,所以需要替换旧的值 
  26.         // 同时和前面过期的对象进行交换位置 
  27.         if (k == key) { 
  28.             e.value = value; 
  29.  
  30.             tab[i] = tab[staleSlot]; 
  31.             tab[staleSlot] = e; 
  32.  
  33.             // 如果 slotToExpunge == staleSlot 说明向前遍历时没有找到过期的 
  34.             if (slotToExpunge == staleSlot) 
  35.                 slotToExpunge = i; 
  36.             // 进行清理过期数据 
  37.             cleanSomeSlots(expungeStaleEntry(slotToExpunge), len); 
  38.             return
  39.         } 
  40.  
  41.         // 如果在向后遍历时,没有找到 value 被回收的 Entry 对象 
  42.         // 且刚开始 staleSlot 的 key 为空,那么它本身就是需要设置 value 的 Entry 对象 
  43.         // 此时不涉及到清理 
  44.         if (k == null && slotToExpunge == staleSlot) 
  45.             slotToExpunge = i; 
  46.     } 
  47.  
  48.     // 如果 key 在数组中找不到,那就好说了,直接创建一个新的就可以了 
  49.     tab[staleSlot].value = null
  50.     tab[staleSlot] = new Entry(key, value); 
  51.  
  52.     // 如果 slotToExpunge != staleSlot 说明存在过期的对象,就需要进行清理 
  53.     if (slotToExpunge != staleSlot) 
  54.         cleanSomeSlots(expungeStaleEntry(slotToExpunge), len); 

在 replaceStaleEntry 方法中,需要注意一下刚开始的两个 for 循环中内容(在这里再贴一下):

  1. if (e.get() == null
  2.     // 当 e.get() == null 时, slotToExpunge 记录下此时的 i 值 
  3.     // 即 slotToExpunge 记录的是 staleSlot 左手边第一个空的 Entry 
  4.     slotToExpunge = i; 
  5.  
  6. if (k == key) { 
  7.     e.value = value; 
  8.  
  9.     tab[i] = tab[staleSlot]; 
  10.     tab[staleSlot] = e; 
  11.                                          
  12.     // 如果 slotToExpunge == staleSlot 说明向前遍历时没有找到过期的 
  13.     if (slotToExpunge == staleSlot) 
  14.         slotToExpunge = i; 
  15.         // 进行清理过期数据 
  16.         cleanSomeSlots(expungeStaleEntry(slotToExpunge), len); 
  17.         return

这两个 for 循环中的 if 到底是在做什么?

看第一个 if ,当 e.get() == null 时,此时将 i 的值给 slotToExpunge

第二个 if ,当 k ==key 时,此时将 i 给了 staleSlot 来进行交换

为什么要对 staleSlot 进行交换呢?画图说明一下

如下图,假设此时表长为 10 ,其中下标为 3 和 5 的 key 已经被回收( key 被回收掉的就是 null ),因为采用的开放地址法,所以 15 mod 10 应该是 5 ,但是因为位置被占,所以在 6 的位置,同样 25 mod 10 也应该是 5 ,但是因为位置被占,下个位置也被占,所以就在第 7 号的位置上了

按照上面的分析,此时 slotToExpunge 值为 3 , staleSlot 值为 5 , i 为 6

假设,假设这个时候如果不进行交换,而是直接回收的话,此时位置为 5 的数据就被回收掉,然后接下来要插入一个 key 为 15 的数据,此时 15 mod 10 算出来是 5 ,正好这个时候位置为 5 的被回收完毕,这个位置就被空出来了,那么此时就会这样:

同样的 key 值竟然出现了两次?!

这肯定是不希望看到的结果,所以一定要进行数据交换

在上面代码中有一行代码 cleanSomeSlots(expungeStaleEntry(slotToExpunge), len); ,说明接下来的处理是交给了 expungeStaleEntry ,接下来去分析一下 expungeStaleEntry

expungeStaleEntry

  1. private int expungeStaleEntry(int staleSlot) { 
  2.     Entry[] tab = table
  3.     int len = tab.length; 
  4.  
  5.     // expunge entry at staleSlot 
  6.     tab[staleSlot].value = null
  7.     tab[staleSlot] = null
  8.     size--; 
  9.  
  10.     // Rehash until we encounter null 
  11.     Entry e; 
  12.     int i; 
  13.     for (i = nextIndex(staleSlot, len); 
  14.         (e = tab[i]) != null
  15.         i = nextIndex(i, len)) { 
  16.         ThreadLocal<?> k = e.get(); 
  17.         // 如果 k == null ,说明 value 就应该被回收掉 
  18.         if (k == null) { 
  19.             // 此时直接将 e.value 置为 null  
  20.             // 这样就将 thread -> threadLocalMap -> value 这条引用链给打破 
  21.             // 方便了 GC 
  22.             e.value = null
  23.             tab[i] = null
  24.             size--; 
  25.         } else { 
  26.             // 这个时候要重新 hash ,因为采用的是开放地址法,所以可以理解为就是将后面的元素向前移动 
  27.             int h = k.threadLocalHashCode & (len - 1); 
  28.             if (h != i) { 
  29.                 tab[i] = null
  30.  
  31.                 // Unlike Knuth 6.4 Algorithm R, we must scan until 
  32.                 // null because multiple entries could have been stale. 
  33.                 while (tab[h] != null
  34.                     h = nextIndex(h, len); 
  35.                 tab[h] = e; 
  36.             } 
  37.         } 
  38.     } 
  39.     return i; 

因为是在 replaceStaleEntry 方法中调用的此方法,传进来的值是 staleSlot ,继续上图,经过 replaceStaleEntry 之后,它的数据结构是这样:

此时传进来的 staleSlot 值为 6 ,因为此时的 key 为 null ,所以接下来会走 e.value = null ,这一步结束之后,就成了:

接下来 i 为 7 ,此时的 key 不为 null ,那么就会重新 hash : int h = k.threadLocalHashCode & (len - 1); ,得到的 h 应该是 5 ,但是实际上 i 为 7 ,说明出现了 hash 冲突,就会继续向下走,最终的结果是这样:

可以看到,原来的 key 为 null ,值为 V5 的已经被回收掉了。我认为之所以回收掉之后,还要再次进行重新 hash ,就是为了防止 key 值重复插入情况的发生

假设 key 为 25 的并没有进行向前移动,也就是它还在位置 7 ,位置 6 是空的,再插入一个 key 为 25 ,经过 hash 应该在位置 5 ,但是有数据了,那就向下走,到了位置 6 ,诶,竟然是空的,赶紧插进去,这不就又造成了上面说到的问题,同样的一个 key 竟然出现了两次?!

而且经过 expungeStaleEntry 之后,将 key 为 null 的值,也设置为了 null ,这样就方便 GC

分析到这里应该就比较明确了,在 expungeStaleEntry 中,有些地方是帮助 GC 的,而通过源码能够发现, set 方法调用了该方法进行了 GC 处理, get 方法也有,不信你瞅瞅:

get

  1. private Entry getEntry(ThreadLocal<?> key) { 
  2.     int i = key.threadLocalHashCode & (table.length - 1); 
  3.     Entry e = table[i]; 
  4.     // 如果能够找到寻找的值,直接 return 即可 
  5.     if (e != null && e.get() == key
  6.         return e; 
  7.     else 
  8.         // 如果找不到,则调用 getEntryAfterMiss 方法去处理 
  9.         return getEntryAfterMiss(key, i, e); 
  10.  
  11. private Entry getEntryAfterMiss(ThreadLocal<?> keyint i, Entry e) { 
  12.     Entry[] tab = table
  13.     int len = tab.length; 
  14.  
  15.     // 一直探测寻找下一个元素,直到找到的元素是要找的 
  16.     while (e != null) { 
  17.         ThreadLocal<?> k = e.get(); 
  18.         if (k == key
  19.             return e; 
  20.         if (k == null
  21.             // 如果 k == null 说明有 value 没有及时回收 
  22.             // 调用 expungeStaleEntry 方法去处理,帮助 GC 
  23.             expungeStaleEntry(i); 
  24.         else 
  25.             i = nextIndex(i, len); 
  26.         e = tab[i]; 
  27.     } 
  28.     return null

get 和 set 方法都有进行帮助 GC ,所以正常情况下是不会有内存溢出的,但是如果创建了之后一直没有调用 get 或者 set 方法,还是有可能会内存溢出

所以最保险的方法就是,使用完之后就及时 remove 一下,加快垃圾回收,就完美的避免了垃圾回收

我 ThreadLocal 虽然没办法做到 100% 的解决内存泄漏问题,但是我能做到 80% 不也应该夸夸我嘛

 

责任编辑:武晓燕 来源: Java极客技术
相关推荐

2020-09-10 07:40:28

ThreadLocal内存

2021-02-18 16:53:44

内存ThreadLocal线程

2020-07-02 09:15:59

Netty内存RPC

2020-11-09 06:00:04

Windows 10Windows操作系统

2023-02-28 07:34:39

ORAOracleMAP

2021-03-03 13:54:31

TypeScript编译器Chirag

2021-06-28 10:06:21

开源文本识别pyWhat

2019-08-12 10:27:34

前端程序员网络

2013-10-31 15:52:11

2020-07-08 07:44:35

面试阿里加班

2014-01-17 14:39:18

12306 抢票

2015-05-06 10:11:48

2009-04-28 10:05:52

阿尔卡特朗韦华恩华为

2020-03-09 10:21:12

Java集合类 Guava

2021-02-05 07:33:44

攻略面试项目

2021-04-21 07:53:12

Java限流器管理

2017-09-07 16:52:23

2022-03-28 15:15:15

神经网络编程开发

2018-03-22 14:59:20

2013-12-18 16:20:20

雷军小米
点赞
收藏

51CTO技术栈公众号