from:http://www.tuicool.com/articles/fMf2quA


FlameGraph

火焰图 ,简单通过x轴横条宽度来度量时间指标,y轴代表线程栈的层次,简单明了, 容易找出具体的可有化点,非常方便,当然前提是我们通过profiler工具获取到profiler 数据。

java profiler

java性能调优时,我们经常会用到profiler工具,但是很多时候你可能不知道,大部分的 profiler工具都是有问题的 , ,简单来说,profiler:增加开销;修改了你的 代码,导致java编译器的优化行为不确定;同时影响了代码的层次,层次越深自然也影响 执行效率。

当然如果你不是通过上面方式实现,二是通过获取on-cpu线程的线程栈方式,这又会带来 一个麻烦的问题:获取系统范围的线程栈,jvm必须处于safepoint 状态,只有当线 程处于safepoint状态的时候,别的线程才能去获取它的线程栈,而这个safepoint是由jvm 控制的,这对于profiler非常不利,有可能一个很热的代码块,jvm不会在该代码块中间放 置safepoint,导致profiler无法获得该线程栈,导致错误的profiler结果。

上面的问题几个商用的profiler工具都存在,Oracle Solaris studio利用的是jvmti的一 个非标准接口AsyncGetCallTrace来实现,不存在上面问题,Jeremy Manson也利用该接口 实现了一个简单的profiler工具: Lightweight Asynchronous Sampling Profiler ,我们 的火焰图的数据来源就是通过它来获取的。

lightweight-java-profiler

当然,这个工具只支持hotspot的vm,需要你自己编译,有些问题需要注意:

  • 如果你需要在rhel上编译,需要安装4.6以上版本gcc ,4.4版本不支持。
  • 如果你需要在ubunt上编译,可能会碰到编译错误 。

编译的时候,需要主要修改BITS参数,如果你要编译64Bit,使用命令:

make BITS=64 all

使用方法很简单,直接在你的启动命令上添加如下参数:

-agentpath:path/to/liblagent.so[:file=name]

启动之后,会在启动目录下生成trace.txt文件(缺省),该文件就是我们需要的采样数据。

另外有几个参数可在编译时修改,都在global.h文件中。首先是采样的频率,缺省是100次 每秒;另外是最大采样的线程栈,缺省3000,超过3000就忽略(对于复杂的应用明显不够) ;最后是栈的深度,缺省是128(对于调用层次深的应用调大)。当然你记录的东西越多, 也会有性能损耗,我调成30000+256,一刻钟生成200M文件。

另外特别需要注意,trace不是实时写入,而是在应用shutdown的时候才写入的,别kill应 用,否则trace里面什么都没有。