纸飞机

  BlogJava :: 首页 :: 新随笔 :: 联系 :: 聚合  :: 管理 ::
  22 随笔 :: 28 文章 :: 30 评论 :: 0 Trackbacks

问题:计算平均数,但希望排除最大和最小值,以(希望能)减少数据畸偏造成的影响。例如,计算除最高和最低工资外的所有职员的平均工资。

解决方案

MySQL和PostgreSQL

使用子查询排除最高和最低值:

1   select avg(sal)

2     from emp

3    where sal not in (

4       (select min(sal) from emp),

5       (select max(sal) from emp)

6    )

DB2、Oracle和SQL Server

使用内联视图及窗口函数MAX OVER和MIN OVER,生成一个结果集,可以很容易地从中剔除最大和最小值:

1   select avg(sal)

2     from (

3   select sal, min(sal)over() min_sal, max(sal)over() max_sal

4     from emp

5          ) x

6    where sal not in (min_sal,max_sal)

讨论

MySQL和PostgreSQL

子查询返回表中的最高工资和最低工资。针对返回的值使用NOT IN,就可以从平均值中排除最高工资和最低工资。记住,如果存在重复(多个职员都是最高或最低工资),那么他们都会被排除在平均值之外。如果只想排除一个最高和最低值,只需从SUM中减去它们,再做除法:

select (sum(sal)-min(sal)-max(sal))/(count(*)-2)

   from emp

DB2、Oracle和SQL Server

内联视图X将返回所有工资,其中包括最高工资和最低工资:

select sal, min(sal)over() min_sal, max(sal)over() max_sal

   from emp

       SAL    MIN_SAL    MAX_SAL

--------- --------- ---------

       800        800       5000

      1600        800       5000

      1250        800       5000

      2975        800       5000

      1250        800       5000

      2850        800       5000

      2450        800       5000

      3000        800       5000

      5000        800       5000

      1500        800       5000

      1100        800       5000

       950        800       5000

      3000        800       5000

      1300        800       5000

从每一行都可以访问最高工资和最低工资,因此,要找出哪些工资是最高工资的和/或最低工资的非常简单。外层查询会对内联视图X返回的行作筛选,这样,所有与MIN_SAL和MAX_SALAN相匹配的行都会从平均值中排除掉。

posted on 2008-05-14 21:49 纸飞机 阅读(1701) 评论(0)  编辑  收藏 所属分类: Database

只有注册用户登录后才能发表评论。


网站导航: