Arthas：Java线上诊断利器，原理、实战与避坑指南-程序员充电站

1. 项目概述：从“救火”到“洞察”的Java诊断利器

如果你是一名Java开发者，或者负责维护线上Java应用，那么你一定经历过这样的场景：某个服务在深夜突然CPU飙升，告警响个不停，但你登录服务器后，除了看到top命令里那个居高不下的Java进程，对内部到底发生了什么一无所知；又或者，一个接口响应时间莫名变长，你怀疑是某个SQL查询变慢了，或是某个缓存失效了，却苦于没有实时的、低侵入性的手段去验证。传统的排查手段，比如加日志、重启应用、分析堆转储文件，要么滞后，要么破坏现场，要么操作繁琐。而今天要深入探讨的Arthas，正是为解决这些“线上疑难杂症”而生的Java诊断工具，它让你能像拥有“透视眼”一样，在不重启应用、不修改代码的前提下，实时洞察JVM内部状态、方法调用、参数、返回值乃至线程堆栈。

Arthas是阿里巴巴开源的Java诊断工具，它基于Java Agent技术，通过Attach机制动态注入到目标JVM进程中。这意味着你无需为应用预先配置任何参数，在问题发生时，随时可以连接上去进行诊断。它的功能强大到令人惊叹：从最基础的查看JVM信息、类加载情况，到监控方法执行耗时、追踪调用链路，再到动态修改运行中类的字节码以添加日志（热更新），几乎涵盖了线上问题排查的所有需求场景。对于开发、测试和运维同学而言，掌握Arthas就如同给日常工作和应急响应配备了一把“瑞士军刀”，能极大地提升问题定位效率和系统可观测性。接下来，我将结合多年使用经验，为你彻底拆解Arthas的核心原理、实战技巧以及那些官方文档里不会写的“避坑指南”。

2. 核心原理与架构设计拆解

要熟练使用一个工具，理解其底层工作原理至关重要。这能帮助你在复杂场景下做出正确判断，避免误操作。

2.1 Java Agent与Attach机制：无侵入接入的基石

Arthas实现“无侵入”诊断的核心，依赖于Java标准库提供的两大机制：Java Agent和Attach API。

Java Agent：通常被称为“Java代理”，它允许你在JVM启动时（通过-javaagent参数）或运行时，动态地修改或增强已加载类的字节码。Arthas的核心能力，如方法执行监控、调用链追踪，都是通过字节码增强（Bytecode Enhancement）技术实现的。例如，当你在Arthas中输入watch命令监控某个方法时，Arthas的Agent会动态地为该方法织入额外的监控代码，这些代码负责记录方法的入参、出参、耗时和异常信息。

Attach API：这是JDK提供的com.sun.tools.attach包下的功能，允许一个JVM进程动态地连接到另一个正在运行的JVM进程，并向其加载一个Agent。这正是Arthas能在不重启应用的情况下接入的关键。当你执行java -jar arthas-boot.jar并选择目标进程ID时，Arthas的引导程序就是通过Attach API，将真正的Arthas Agent Jar包注入到目标JVM中。

注意：Attach操作需要操作系统权限。在Linux下，执行Arthas的用户必须与目标Java进程的启动用户相同，或者是root用户。否则会遇到“Unable to open socket file”权限错误，这是新手常踩的第一个坑。

2.2 字节码增强与Instrumentation：动态监控的实现

Instrumentation是Java Agent使用的核心API。Arthas Agent被加载后，会获得一个Instrumentation实例，通过它，可以注册自己的ClassFileTransformer（类文件转换器）。

当JVM加载某个类时，会回调所有注册的ClassFileTransformer，传入该类的原始字节码。Transformer可以对其进行分析和修改，并返回新的字节码给JVM加载。Arthas的各种命令，本质上是向Agent注册了不同的Transformer。例如：

trace命令：会为指定类的方法织入代码，在方法入口、出口以及内部调用点记录信息，从而构建出调用链路树。
watch命令：织入的代码更侧重于在方法执行前后“观察”，记录下当时的参数、返回值或异常对象。
jad/mc/redefine热更新命令链：jad反编译，mc在内存中编译修改后的代码，redefine则通过Instrumentation的redefineClasses方法，用新的字节码替换JVM中已存在的类定义。

这种动态修改的能力非常强大，但也伴随着风险。错误地修改核心类（如java.lang.String）或频繁重定义类，可能导致JVM不稳定。因此，Arthas的所有监控命令在退出时，都会尝试卸载对应的Transformer，恢复类到原始状态（通过reset命令也可以手动完成）。但热更新（redefine）是永久性的，直到下次应用重启。

2.3 客户端-服务器架构与Telnet/WebSocket通信

Arthas采用经典的C/S架构。注入到目标JVM的Agent作为服务器（Server），我们通过命令行或Web Console连接的则是客户端（Client）。

通信协议：默认使用Telnet协议（端口3658），也支持WebSocket（端口8563）。Telnet协议简单通用，几乎所有操作系统都自带客户端，方便快速上手。WebSocket则为浏览器端的Web Console提供了支持，实现了更友好的图形化界面。

会话管理：Arthas支持多个客户端同时连接，每个连接是一个独立会话（Session）。命令在不同的会话中执行是隔离的，这方便多个开发者同时排查问题而互不干扰。你可以使用session命令查看当前会话信息，使用stop命令退出当前客户端连接（但Agent仍在目标JVM中运行），使用shutdown命令则彻底关闭Arthas服务端并清理所有增强的类。

理解这个架构有助于解决网络连通性问题。例如，在容器化部署时，需要确保Arthas客户端的网络能够访问到目标容器内的3658或8563端口。

3. 环境准备与安装部署详解

工欲善其事，必先利其器。Arthas的安装虽然简单，但在生产环境中有许多细节需要注意。

3.1 多种安装方式与适用场景

Arthas提供了极其灵活的安装方式，以适应不同环境。

一键安装脚本（推荐用于快速体验和测试环境）：
```
curl -L https://arthas.aliyun.com/arthas-boot.jar -o arthas-boot.jar java -jar arthas-boot.jar
```
执行后，脚本会自动列出当前机器上所有的Java进程，输入序号即可连接。这是最快捷的方式，脚本会自动下载最新版的Arthas。
全量包安装：直接从GitHub Release页面下载如arthas-packaging-3.7.2-bin.zip的压缩包，解压后即可使用其中的arthas-boot.jar。这种方式适合网络受限、需要离线部署的环境。你可以将解压后的整个文件夹分发给所有服务器。
通过包管理工具安装：
- Linux/Mac (Homebrew):brew install arthas
- Windows (Scoop):scoop install arthas这种方式将Arthas安装到系统路径，方便全局调用，但可能不是最新版本。
容器内安装：在Docker容器中排查问题，通常需要将Arthas打包进基础镜像，或者在运行时进入容器安装。方案一（构建时集成）：在Dockerfile中加入下载Arthas的步骤。方案二（运行时挂载）：将宿主机上的Arthas目录通过-v卷挂载到容器内，然后进入容器执行。更推荐使用docker cp命令将arthas-boot.jar复制到正在运行的容器中。
```
docker cp arthas-boot.jar <container_id>:/tmp/ docker exec -it <container_id> /bin/bash cd /tmp && java -jar arthas-boot.jar
```

3.2 权限与路径避坑指南

在生产环境安装时，权限和路径问题是最常见的拦路虎。

用户权限问题：如前所述，Attach操作要求执行用户与目标JVM进程用户一致。如果你用admin用户启动的应用，却用root去执行Arthas，可能会失败。最佳实践是切换到应用启动用户后再执行Arthas。
```
sudo -u <app_user> java -jar arthas-boot.jar
```
$JAVA_HOME与tools.jar：Arthas的Attach机制依赖JDK下的tools.jar（在$JAVA_HOME/lib/目录下）。确保环境变量JAVA_HOME指向的是JDK，而不是JRE。JRE不包含tools.jar。你可以通过which java和java -version来检查。如果只有JRE，需要安装完整的JDK。
临时目录权限：Arthas在运行过程中会在系统的临时目录（如/tmp）下生成一些文件。确保应用启动用户对该目录有写权限。在某些严格的SELinux或安全加固环境下，可能需要调整策略。
网络防火墙：如果通过Web Console访问，需确保服务器安全组和本地防火墙开放了8563端口。Telnet的3658端口同样需要注意。

3.3 首次连接与基础配置

成功执行java -jar arthas-boot.jar后，你会看到一个进程列表。输入编号，回车，Arthas便开始注入。如果看到类似[INFO] arthas-server start in ...和[INFO] Successfully bind to port: 3658的日志，并且命令行提示符变成了[arthas@进程ID]$，恭喜你，连接成功了。

几个有用的初始命令：

help：查看所有命令列表。对任何命令有疑问，都可以help <command>，如help watch。
dashboard：仪表盘，整体查看线程、内存、GC、运行时信息。这是快速了解应用健康状况的“总览图”。
quit/exit：退出当前Arthas客户端连接，但Arthas服务端仍在目标JVM中运行。
stop：与quit效果类似。
shutdown：关闭Arthas服务端，并清理所有增强的类。这是彻底的退出。
keymap：显示所有快捷键，如Ctrl+C中断当前命令，Tab自动补全等。

4. 核心命令实战与场景化应用

Arthas命令繁多，但掌握核心的七八个，就能解决80%的问题。下面我们结合具体场景，深入讲解最常用的命令。

4.1 全局视角：dashboard与jvm命令

当应用出现整体性异常，如CPU高、负载高、响应慢时，首先需要的是一个全局视角。

dashboard命令：这是你的“驾驶舱”。它会以实时刷新的方式展示：

线程视图：显示所有线程的状态（RUNNABLE, BLOCKED, WAITING等）、CPU使用率、运行时间。快速定位哪个线程在疯狂消耗CPU。
内存视图：展示堆内存（Eden, Survivor, Old Gen）和各非堆区的使用情况，直观判断是否有内存泄漏或GC问题。
GC统计：显示各代GC的次数和耗时，如果FGC（Full GC）频繁且耗时久，那系统卡顿的元凶很可能就是它。
运行时信息：操作系统负载、JVM版本、启动参数等。

实战技巧：通过dashboard发现一个线程CPU占用率长期超过50%。记下这个线程的ID（如23），然后使用thread 23命令查看该线程的详细堆栈，就能知道它在执行什么代码。

jvm命令：提供更静态、更详细的JVM信息。比如查看具体的启动参数（jvm）、查看所有系统属性（sysprop）、查看所有环境变量（sysenv）。排查“为什么我的配置不生效”这类问题时，sysprop特别有用，它可以确认JVM实际读到的系统属性值，而不是你配置文件里写的值。

4.2 类与类加载器洞察：sc与jad

当遇到ClassNotFoundException,NoSuchMethodError或怀疑jar包冲突时，这两个命令是利器。

sc(Search Class)命令：用于搜索JVM中已加载的类。支持模糊搜索和详细查看。

sc demo.*：查找包名以demo开头的所有类。
sc -d com.example.MyClass：查看某个类的详细信息，包括来源jar包、类加载器、继承关系等。-d参数显示的信息至关重要，它能告诉你这个类是从哪个jar包的什么位置加载的，是诊断jar包冲突（同一个类被多个ClassLoader加载了不同版本）的直接证据。

jad(Java Decompiler)命令：反编译指定类的字节码为可读的Java源代码。

jad com.example.MyClass：反编译整个类。
jad --source-only com.example.MyClass：只输出源代码，不包含元信息，方便复制。
jad com.example.MyClass methodName：反编译特定方法。

实战场景：线上报错NoSuchMethodError: com.example.Foo.bar()V。你可以：

sc -d com.example.Foo查看当前加载的Foo类的详细信息，记下它的类加载器和来源jar包。
怀疑有旧版本的jar包，可以用sc -d *Foo搜索所有包含Foo的类，看是否有另一个版本的Foo被其他ClassLoader加载了。
用jad com.example.Foo反编译当前加载的Foo类，确认bar方法是否存在，签名是否正确。

4.3 方法级监控神器：watch与trace

这是Arthas使用频率最高、最强大的功能组，用于定位方法执行慢、参数不对、返回值异常等问题。

watch命令：观察方法执行时的数据。其核心在于“观察点表达式（ognl表达式）”。基本语法：watch 类全限定名方法名 “观察表达式” -x 输出深度

watch com.example.Service getData '{params, returnObj}' -x 3：观察getData方法的入参（params）和返回值（returnObj），-x 3表示展开对象层级到第3层。
watch com.example.Service getData ‘{params[0], throwExp}’：观察第一个入参和抛出的异常（如果有）。
watch com.example.Service * ‘{params, returnObj, #cost}’：观察该类的所有方法，#cost是内置变量，代表方法耗时。

trace命令：追踪方法内部的调用链路，并统计每个节点的耗时。用于定位“一个方法内部到底哪一步慢了”。基本语法：trace 类全限定名方法名

trace com.example.OrderService createOrder：这会打印出createOrder方法内部所有调用的方法链，并显示每个调用的耗时。耗时长的节点会被标红，一目了然。
trace -j com.example.OrderService createOrder：-j参数会过滤掉JDK内部方法的调用，只显示业务代码，让链路更清晰。

实战心得：

性能开销：watch和trace通过字节码增强实现，会给被监控方法带来一定的性能开销（通常在5%-30%之间，取决于监控的粒度）。切忌在生产环境长时间、大范围地监控核心高频接口。定位到问题后，应及时使用stop停止该监控任务，或用reset重置所有增强。
表达式技巧：OGNL表达式非常强大。除了params（参数数组）、returnObj（返回值）、throwExp（异常）、#cost（耗时）外，你还可以直接调用对象的Getter方法，例如watch *UserService* * ‘{params[0].getName(), returnObj.id}’。
过滤与条件：可以使用-n参数限制执行次数，例如watch ... -n 5只观察5次。还可以使用条件过滤，例如watch ... ‘{params, returnObj}’ ‘params[0] != null’，只在第一个参数不为空时触发观察。

4.4 线程问题定位：thread与thread -b

线程死锁、大量线程阻塞是导致应用卡顿的常见原因。

thread命令：查看所有线程信息。

thread：列出所有线程，及其状态和CPU时间。
thread 23：查看ID为23的线程的详细堆栈。
thread -n 3：显示CPU占用率最高的3个线程。
thread -i 1000：指定采样时间间隔为1000ms，统计这段时间内的线程CPU使用情况，比瞬时值更准确。

thread -b命令：一键检测死锁。这是排查死锁问题最快的方式。执行后，如果存在死锁，Arthas会直接打印出参与死锁的线程ID和它们持有的锁、等待的锁信息。

实战场景：应用突然不响应请求，但进程还在。快速操作：

dashboard或thread -n 5查看是否有线程CPU异常高或大量线程处于BLOCKED状态。
thread -b检查是否存在死锁。
如果发现大量线程阻塞在同一个锁上，使用thread <阻塞线程ID>查看堆栈，找到竞争的资源（通常是某个同步方法或锁对象），再结合jad反编译相关代码分析逻辑。

4.5 动态热更新：jad/mc/redefine 三部曲

这是Arthas最“黑科技”的功能，允许你在线修改代码并立即生效。务必谨慎使用，仅限紧急止血或测试环境验证。

jad反编译：将线上运行的类反编译为Java文件。

jad --source-only com.example.BugService > /tmp/BugService.java

本地编辑：使用vim等编辑器修改/tmp/BugService.java文件，例如修复一个空指针判断。
mc内存编译：在内存中将修改后的Java文件编译成字节码。
```
mc /tmp/BugService.java -d /tmp
```
这会在/tmp目录下生成com/example/BugService.class文件。
redefine重定义：用新的字节码文件替换JVM中的旧类。
```
redefine /tmp/com/example/BugService.class
```
如果成功，你会看到redefine success的提示。之后，所有新的方法调用都会执行修改后的逻辑。

重大限制与风险提示：

方法签名不能改：不能增加、删除或修改方法签名（名称、参数、返回类型）。只能修改方法体内部的逻辑。
不能增删字段/方法：类的结构（字段、方法数量）不能改变。
对某些类无效：java.lang.*下的核心类以及被Bootstrap ClassLoader加载的类通常无法重定义。
可能导致内存泄漏或状态不一致：如果修改的代码逻辑与类中已有的静态变量或实例变量状态不匹配，可能引发诡异问题。
并非真正“热部署”：已创建的实例对象，其虚方法表（vtable）可能不会立即更新，在某些继承和多态场景下可能不生效。

因此，这个功能的最佳用途是：

紧急修复一个简单的、局部的逻辑错误（如增加一个null判断）。
临时添加一些调试日志（但更推荐用tt命令，见下文）。
在预发布环境验证一个修复思路，而不用重新打包部署。

4.6 时间隧道：tt (TimeTunnel)命令

tt命令是watch的一个强大补充，它记录了方法调用的“现场”，并允许你事后“重放”这个现场，甚至修改入参进行重试。它比watch更强大，因为记录的信息可以反复查看和操作。

核心操作：

tt -t com.example.Service getData -n 5：开始记录getData方法最近5次的调用。-t表示记录，-n限制次数。
tt -l：列出所有记录的方法调用信息，每条记录有一个唯一的INDEX。
tt -i 1000：查看INDEX为1000的记录的详细信息，包括参数、返回值、异常和完整的调用堆栈。
tt -i 1000 -p：重放这次调用。这会重新执行一次当时的方法调用，使用当时记录的参数，并返回新的结果。这在复现问题或测试不同参数时非常有用。
tt -i 1000 -w ‘params[0]’：使用OGNL表达式观察记录中特定对象的状态。

实战场景：用户反馈某笔订单状态更新失败，但只提供了订单号。你可以：

用tt -t com.example.OrderService updateStatus -n 100记录最近100次更新方法的调用。
让用户重新操作一次，触发问题。
使用tt -l找到刚刚记录的那条调用（可能通过时间或参数中的订单号判断）。
用tt -i <INDEX> -p重放，观察是否依然失败。用tt -i <INDEX>查看详细的异常堆栈。你甚至可以临时修改代码（用jad/mc/redefine）增加日志，然后重放来获取更详细的调试信息。

tt命令将方法的调用“时空”保存下来，为事后深度分析提供了可能，是排查难以复现的偶发性问题的利器。

5. 高级技巧与生产环境最佳实践

掌握了基础命令，我们再来看看如何组合使用，以及在生产环境中安全、高效地使用Arthas。

5.1 命令组合与管道操作

Arthas支持简单的管道操作，可以将一个命令的输出作为另一个命令的输入，这极大地提升了排查效率。

查找被某个ClassLoader加载的所有类：
```
sc -d * | grep -E "classLoaderHash|class-info" | grep -B1 -A1 <classLoaderHash>
```
先搜索所有类信息，然后通过grep过滤出特定ClassLoaderHash相关的行。
监控某个包下所有方法的耗时：
```
trace com.example.service.*
```
但这样可能太泛。更好的方法是先用watch观察概貌，再用trace深入慢方法。
结合grep筛选输出：Arthas本身输出内容可能很多，在Linux/Mac环境下，你可以结合系统的grep,head,tail进行过滤。例如thread | grep “BLOCKED”查看所有阻塞的线程。

5.2 后台任务与异步执行

有些监控命令（如长时间监控的watch、trace）会持续输出。你可以使用快捷键Ctrl+Z将它们挂起到后台，然后使用jobs命令查看所有后台任务，使用fg <job-id>将其调回前台，或使用bg <job-id>让其在后台继续运行。

更常见的是，你希望启动一个监控后，退出当前Arthas客户端（比如关闭SSH连接），但让监控任务在服务器上继续运行。这时可以使用async后台执行命令，并通过>将输出重定向到文件。

# 启动一个后台监控，输出到文件 watch com.example.Service getData ‘{params, returnObj, #cost}’ -x 2 > /tmp/watch.log & # 然后可以安全地退出客户端

之后你可以通过tail -f /tmp/watch.log来查看实时日志。记得任务完成后，要用kill命令或重新连接Arthas使用stop命令来停止它，以免造成持续的性能开销。

5.3 生产环境安全使用准则

在生产环境使用Arthas，能力越大，责任越大。

最小权限原则：使用专门的、权限受限的运维账号来执行Arthas，而不是root。并通过堡垒机（跳板机）进行访问，记录所有操作日志。
明确目的，速战速决：只在需要排查具体问题时连接，问题解决后立即执行shutdown退出。避免长时间连接，减少不必要的字节码增强带来的性能影响和安全风险。
避免监控高频核心方法：对QPS极高的核心接口使用watch或trace，可能会显著增加RT（响应时间）甚至成为性能瓶颈。如果必须监控，使用-n参数限制次数，或只在流量低峰期进行。
谨慎使用热更新：redefine是“外科手术”，只应用于真正的紧急线上Bug修复，且修改范围要尽可能小。修改后，必须安排常规的发布流程来永久性修复代码。绝对不要依赖热更新作为常规发布手段。
做好应急预案：在使用Arthas进行任何有风险的操作（如热更新、大量方法监控）前，确保你有回滚方案或重启应用的准备。如果操作后应用行为异常，最快最安全的方式往往是重启应用。
网络隔离：确保Arthas的Telnet/WebSocket端口（3658/8563）不对公网开放，最好是在防火墙策略中只允许特定的运维网络段访问。

5.4 性能开销分析与监控

很多人关心Arthas本身带来的性能损耗。主要开销来自两方面：

字节码增强：watch,trace,tt,monitor等命令会修改类字节码，增加执行逻辑。开销与增强的复杂度成正比。简单的参数观察开销较小（可能5%以内），而trace记录完整调用链的开销则可能达到20%-30%。
数据收集与传输：监控数据的收集、处理以及通过网络发送到客户端，也会消耗CPU和网络IO。

建议：在关键业务应用上，可以通过对比开启监控前后的接口RT、CPU使用率来量化影响。通常，短时间、有针对性的诊断开销是可以接受的。Arthas也提供了一些轻量级命令，如vmtool（获取静态信息）、ognl（执行表达式）等，它们不涉及字节码增强，开销极低。

6. 常见问题排查与解决方案实录

即使对工具很熟悉，在实际使用中还是会遇到各种问题。这里记录了一些典型问题和解决方法。

6.1 连接与启动问题

问题现象	可能原因	解决方案
`Attach to process failed`	1. 执行用户与目标进程用户不同。 2. 目标进程是`init`进程或内核线程。 3. 目标JVM是JDK 9+且未开启`-Djdk.attach.allowAttachSelf`。	1.`sudo -u <app_user>`切换用户。 2. 确认进程ID是否正确。 3. 对于JDK 9+，在目标JVM启动参数中添加`-Djdk.attach.allowAttachSelf=true`。
`Can not find tools.jar`	`JAVA_HOME`指向了JRE，或者环境变量未设置。	检查`java -version`和`echo $JAVA_HOME`，确保指向完整的JDK目录。
选择进程后长时间无响应	网络问题，或目标JVM处于僵死状态（如深度GC）。	检查网络，或尝试重启Arthas客户端。对于僵死进程，可能需先恢复JVM或强制结束。
Web Console无法访问	8563端口未开放，或Arthas版本旧。	检查防火墙，确认启动日志中有`WebSocket listen on 0.0.0.0:8563`。使用`--telnet-port 8563 --http-port 8564`指定端口。

6.2 命令执行与输出问题

问题现象	可能原因	解决方案
`watch`/`trace`命令无输出	1. 类名/方法名拼写错误。 2. 方法从未被调用过。 3. 方法被内联等JVM优化了。	1. 使用`sc 类名`确认类已加载，使用`sm 类全名方法名`查看方法签名。 2. 触发一次方法调用。 3. 尝试关闭JIT编译（不推荐生产环境），或监控其调用者。
`ognl`表达式执行报错	OGNL表达式语法错误，或上下文对象不对。	使用简单的表达式测试，如`ognl ‘@java.lang.System@currentTimeMillis()’`。查看`help ognl`获取帮助。
输出内容过多，刷屏	监控的方法被高频调用。	1. 使用`-n`参数限制次数。 2. 使用条件表达式过滤，如`‘params[0]!=null && #cost>100’`。 3. 重定向输出到文件。
`redefine`失败，报错`class redefinition failed`	违反了热更新的限制（如修改了方法签名、增加了字段）。	检查修改内容是否只涉及方法体逻辑。对于结构性修改，必须通过重启应用发布。

6.3 资源清理与状态恢复

问题现象	可能原因	解决方案
退出Arthas后，应用性能依然下降	字节码增强未完全清理。	重新连接Arthas，执行`reset`命令重置所有增强的类。然后正常`shutdown`退出。
忘记`shutdown`，直接关闭了客户端	Arthas服务端仍在目标JVM中运行。	重新连接Arthas，执行`shutdown`。或者，如果知道进程ID，可以用`java -jar arthas-boot.jar --target-pid <pid> --shutdown`远程关闭。
监控命令停不下来	命令在前台或后台持续运行。	1. 前台运行：按`Ctrl+C`中断。 2. 后台运行：先用`jobs`查看，再用`kill <job-id>`停止。或重新连接执行`stop`停止所有任务。

6.4 与第三方组件集成的问题

Spring Boot / Spring Cloud：Arthas与Spring系列兼容性很好。注意Spring使用的CGLIB代理或JDK动态代理可能会使类的实际名称发生变化（如$$EnhancerBySpringCGLIB$$）。使用sc *类名*来搜索时，要包含这些代理类。watch和trace时，也需要指定代理类的全名。
使用-javaagent启动的应用：如果应用已经通过-javaagent参数加载了其他Agent（如SkyWalking, Pinpoint等），Arthas仍然可以Attach。但多个Agent都进行字节码增强时，可能存在冲突或顺序问题，需注意观察。
容器环境（Docker/K8s）：主要问题是镜像中可能没有JDK（只有JRE），或者/tmp目录权限不足。确保基础镜像包含tools.jar，或者考虑使用Arthas的Docker镜像（hengyunabc/arthas）通过docker exec进入容器排查。

在我个人的使用经验中，Arthas最宝贵的价值在于它提供了一种“即时”的、深入JVM内部的观察能力。它改变了我们排查线上问题的模式——从“猜日志、压日志、等发布”的漫长循环，转变为“连接、观察、定位、验证”的快速闭环。然而，利器虽好，也需善用。时刻记住它的性能影响和安全边界，将其作为诊断工具箱中的“特种装备”，而非日常运行的“常驻组件”，才能让它真正为系统的稳定性和研发的幸福感保驾护航。