捉虫记--大容量Web应用性能测试与LoadRunner实战(连载四)

10原则。
　　在3秒钟之内，页面给予用户响应并有所显示被认为是"不错的"。
　　在3～5秒钟内，页面给予用户响应并有所显示被认为是"好的"。
　　而5～10秒钟是可以"勉强接受的"。
　　超过10秒钟就有点让人不耐烦了，用户很可能不会继续等待下去。
　　在尽可能合理的情况下，响应时间应该越快越好。
　　另外，响应时间包含了网络传输数据的时间、DNS记录查找时间和真正由网站服务器处理的时间，因此，遇到时间间隔很长的情况时，首先要排除前两个时间的影响。
　　另外，还有很重要的两点不能忽略：
　　小白只是以一个用户的身份去访问网站的测试版本，而网站一旦投入使用，真实情况是会有上万人同时访问它，那么响应时间还会有现在这么好吗？
　　小白是在公司内部进行测试的，要知道公司内部的局域网一般都是百兆、千兆网，速度非常快；如果换到家里，用ADSL之类的上网条件，响应时间还会如此快吗？
　　这几个问题都说明小白的这次性能测试确实欠缺很多因素。不过，这正是我们在下面的章节要学习的。
　　2．测试场所和指标的问题
　　小白在进行测试的时候，记录的是自己电脑上的时间间隔，从它数值的大小来间接判断服务器端性能的好坏。那么，能不能直接获得服务器端的性能数据，岂不是更加精确吗？
　　是的，完全可以。响应时间所带给人的只是性能好坏的大概印象，如果要更加专业的测试性能，需要获取服务器端的指标数据，我们管这些指标叫做性能计数器（Performance Counter），在第6章，我们将重点介绍它们的单个含义以及获取方法。
　　综上所述，小白基于目前理解的第一次性能测试有了结果，虽然过程远远不够，但也让我们体会到了性能测试所关注的要点，进行的大致过程。简单地说，Web应用的性能测试方法，就是通过模拟若干用户对于网站的访问，获得性能计数器和其他指标的数据，再分析它们以进行性能评估，使得关注性能测试的各方对系统性能有基本的认识。

　　5.1.7 压力测试（Stress Testing）
　　相对于前面性能测试方法的普通，压力测试（Stress Testing）方法可以说走了一个极端。它测试Web应用在事先规定的某种饱和状态下，比如CPU处于75%利用率的情况下，系统是否还具备处理业务的能力，或者系统会发生什么样的状况（出现错误？系统宕机？等）。
　　一句话，压力测试是考验一个系统的抗压能力的：在当前比较大的压力下，它能否承受得住。压力测试的目的是为了测试Web应用的稳定性。
　　【压力测试与体操比赛】
　　在体育比赛场上我们可以看到生活中的压力测试，例如体操比赛中的规定动作环节。场上选手在比赛时，其动作组合必须包含组委会所设定的所有规定动作，如图5-3所示的经典规定动作--托马斯全旋。通过在这样的条件下比赛，裁判来考察运动员的完成质量，由于动作难度系数基本一致，重点将是完成质量的稳定性。通过这个类比，压力测试就很好理解了。
图5-3 类似压力测试的体操规定动作比赛（图中动作为托马斯全旋）
　　压力测试方法有如下的两个特点：
　　（1）压力测试方法的目的是测试系统（本书中为Web应用）的稳定性。人们对很多软件系统都有这样一个经验：当系统处于较大压力的时候，如果还能够维持正常工作，那么，就能说明它在压力不大的一般条件下，具有长时间正常工作的能力。从这里可以看出，压力测试方法有一点“一叶知秋”、“以小见大”的含义在其中。
　　（2）压力测试方法的具体操作过程是通过对系统施加负荷（模拟用户对Web应用的访问等），使系统的资源占用保持在一个事先约定的水平（比如前文所提到的CPU占用率75%），来检验此时系统的表现。测试的重点在于系统对于用户的响应时间变化、系统是否出现错误甚至崩溃等。
　　5.1.8 负载测试（Stress Testing）简介
　　在实际工作中，负载测试方法和压力测试方法往往被放在一起谈论，因此很容易混淆，其实它们的区别是很明显的。
　　【负载测试方法】
　　负载测试（Load Testing）方法通过在被测试系统上不断增加负荷，直到事先选定的性能指标（比如响应时间），变为不可接受或系统的某类资源使用已经达到饱和状态。负载测试方法实际就是一个不断加压，直到找到系统不可用临界点的过程，形象地说，那一点正是“强弩之末”。
　【负载测试方法与举重比赛】
　　在5.1.7节我们把压力测试和体操比赛的规定动作相类比，在这里我们将负载测试方法类比为举重比赛，如图5-4所示。在比赛中，选手不断地增加重量，挑战自己的极限，直到杠铃加到某一个重量时，3次试举都失败。这一重量就是举重比赛的最终结果。
图5-4 举重比赛与负载测试有相同之处
　　通过负载测试方法，我们可以发现系统的处理极限点在哪里。
　　5.1.9 负载测试的特点
　　负载测试方法有如下几个特点。
　　（1）它的主要目的在于找到系统处理能力的极限，为系统进一步优化做参考。另外，这种测试也可以用来比较不同的优化方法对于性能极限的提升，因此也可以称之为可扩展性测试（Scalability Testing）。这个名词可以用图5-5清晰地表述出来。
　　在图5-5中，2条曲线分别代表两种优化方法经历负载测试的结果。A方法的性能极限在A点，B方法的性能极限在B点。根据负载测试的定义，比A、B两点值小的部分都是系统的安全运行区间。由于B的数值要大于A，说明采用B方法优化，系统的可扩展性提高了。
图5-5 负载测试用于优化方法的比较：B好于A
　　（2）负载测试方法的操作是一个不断加压的过程。负载测试方法是一个"性能指标记录--增加负荷"的操作循环，直到预定被关注的性能指标不再令人满意。这个极限点在测试结果中的表示类似这样的形式："在给定条件下当前Web应用将最多允许10000个并发用户访问"、"在给定条件下当前Web应用最多能够在1分钟内处理1000次用户对数据库的修改"等。常见的在负载测试方法中被关注的性能指标包括：Web应用的响应时间、Web服务器平均CPU利用率等，它们的具体数值需要根据实际情况来调整。
　　（3）负载测试方法要考虑被测Web应用的实际业务负荷量与正确的使用场景，以保证测试结果具有参考价值。
　　【实战演练：教训】
　　在这方面，笔者的同事曾经有一个教训。有一个网站，可以通过Web直接访问，也可以通过RSS进行订阅。在网站发布之前，网站技术部门的所有工程师都认为绝大部分用户都是通过Web来访问的，因此，在时间紧迫的情况下，重点测试了Web访问的性能，对于RSS相关代码测试的就很少。结果在网站上线之后，他们惊奇地发现，大部分用户访问都是通过RSS来完成的，因为负载测试做的很简略，结果每过多久服务器就被拖的几乎无法访问了。可见，对于负载测试，乃至整个性能测试而言，模拟真实的应用场景是多么的关键。
　　（未完待续）
相关链接：
捉虫记--大容量Web应用性能测试与LoadRunner实战(连载一)
捉虫记--大容量Web应用性能测试与LoadRunner实战(连载二)
捉虫记--大容量Web应用性能测试与LoadRunner实战(连载三)

qileilove

捉虫记--大容量Web应用性能测试与LoadRunner实战(连载四)