[Java] Java Distributed GC and -XX:+DisableExplicitGC option

자바 프로그램에서 OutOfMemoryError 는 흔하게 발생하지만, 그 원인이 무척 다양하기 때문에 단순하게 메모리 부족으로 판단해서는 안된다.

에러 메시지에서 구분할 수 있는 세 가지는 1. heap memory가 부족한 경우, 2. perm area memory가 부족한 경우, 3. 새로운 thread를 생성할 수 없는 경우이다.

heap memory가 부족한 것은 JVM에 지정한 최대 heap 메모리 크기보다 더 큰 메모리 영역을 사용하려고 시도했기 때문인데 application이 memory leak을 발생시켜 사용 메모리가 점점 증가하는 경우라면 application의 leak을 해결하든지, 주기적으로 JVM을 재구동하든지 해야 한다. 그것이 아니라 순간적으로 큰 메모리를 사용할 가능성이 높은 applicaiton이라면 JVM의 최대 heap 크기를 늘려줘야 할 것이다.

이와 달리 perm area 부족의 경우는 조금 다른데 Sun(지금은 Oracle)의 HotSpot JVM에서는 permanent area 에 String 상수 풀이나 define된 클래스 정보들을 두고 있다.

보통의 경우 상수 풀이나 클래스 정보는 한번 load되면 unload할 일이 없지만, application의 특성에 따라 pluggable module 이 필요한 경우 이를 구현하기 위해 동적으로 ClassLoader를 생성하고 삭제하는 방법을 흔히 사용하는데, 이때 클래스 정보들이 적절히 unload되지 않으면 perm area에서도 memory leak이 생기게 된다.
즉, perm area에서의 memory leak은 ClassLoader 객체가 제대로 garbage collect 되지 않을 때 발생한다.

application에서 memory leak이 발생시키지 않은 경우에도 gc 옵션을 잘못 지정하여 발생할 수도 있는데, 흔히 발생했던 원인 중 하나는 JVM에서 CMS (Concurrent Mark and Sweep) gc 알고리즘을 지정한 경우이다.

CMS gc 알고리즘에서는 기본값으로는 perm area 에 대해 gc를 하지 않는다.

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6329603

이 경우 해결책은 CMS 알고리즘을 쓰지 않거나 다음 옵션을 추가하는 것이다.

-XX:+CMSPermGenSweepingEnabled -XX:+CMSClassUnloadingEnabled

최근에 이와 다른 이유로 perm area 에서 OutOfMemoryError가 나는 경우가 있어, heap dump를 분석해본 적이 있다. 뜻밖에도 remote 객체가 ClassLoader를 reference하고 있어서 ClassLoader가 gc되지 못한 경우였다.
RMI 혹은 EJB (JRMP)를 사용하는 application이었는데 gc가 안정적으로 실행되도록 -XX:+DisableExplicitGC 옵션을 켜놓았었다.

-XX:+DisableExplicitGC 옵션은 System.gc() 메소드를 호출해도 아무 일이 일어나지 않도록 한다.
이 때문에 분산 gc가 제대로 수행되지 않아서 ClassLoader가 gc되지 못하였고, 결국 perm area가 full이 났던 것이다.

자바의 분산 gc (distributed gc, 즉 원격 객체에 대한 gc) 알고리즘은 기본적으로 60초마다 System.gc() 메커니즘에 따라 full gc를 요청하게 된다.
이때, 더 이상 사용하지 않는 원격 객체에 대한 참조 count를 떨어뜨리고, 더 이상 원격 객체에 대한 참조가 없으면 unexport를 하게 된다.

이 간격을 늘리려면 기본값인 60,000(60초)을 3,6000,000(1시간) 정도로 바꿔주면 된다.

-Dsun.rmi.dgc.client.gcInterval=36000000
-Dsun.rmi.dgc.server.gcInterval=36000000

분산 gc가 발생할 때마다 full gc가 일어나는 것 때문에 시스템 성능이 급격히 떨어지는 것을 막기 위해 다음 요청이 접수되었다.

http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=5025281

Sun에서는 JDK 1.6부터는 다음 JVM 옵션을 사용할 수 있도록 개선하였다. 또 dgc 간격 기본값을 1분에서 1시간으로 늘렸다.

-XX:+ExplicitGCInvokesConcurrent

이 옵션이 설정된 경우는 System.gc()가 호출되더라도 gc 알고리즘이 concurrent gc 인 경우 full gc가 일어나는 것이 아니라 concurrent gc 를 실행한다.

따라서, RMI나 EJB를 사용하는 경우의 HotSpot VM 튜닝은 다음을 권장한다.

1. -XX:+DisableExplicitGC 은 설정하지 않는 게 좋다.
2. JDK 1.5 이하일 경우에는 dgc interval을 늘려준다. 보통 1시간 정도면 괜찮다.

 -Dsun.rmi.dgc.client.gcInterval=36000000
 -Dsun.rmi.dgc.server.gcInterval=36000000

3. JDK 1.6 이상일 경우에는 다음 옵션만 켜주면 큰 문제가 없다. dgc interval은 기본값이 이미 1시간으로 변경되어 있으므로 수정할 필요가 없다.

-XX:+ExplicitGCInvokesConcurrent

댓글

miso_leaf님의 메시지…
좋은 글 감사합니다.
퍼갑니다~

이 블로그의 인기 게시물

[Java] Java G1 GC의 특성에 따른 Full GC 회피 튜닝 방법

엄밀한 사고(Critical Thinking)란 무엇일까

일론 머스크의 First Principle Thinking (제1원리 기반 사고)