加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 站长学院 > MySql教程 > 正文

MySQL如何计算数据中位数详析

发布时间:2023-09-02 13:55:48 所属栏目:MySql教程 来源:
导读:要得到一组数据的中位数(例如某个地区或某家公司的收入中位数),我们一般要将这一任务细分为 3 个小任务:

1.将数据排序,并给每一行数据给出其在所有数据中的排名;

2.找出中位数的排名数字;

3.找出
要得到一组数据的中位数(例如某个地区或某家公司的收入中位数),我们一般要将这一任务细分为 3 个小任务:
 
1.将数据排序,并给每一行数据给出其在所有数据中的排名;
 
2.找出中位数的排名数字;
 
3.找出中间排名对应的值;
 
下面以某公司员工月收入为例,示例 MySQL 的一些复杂语句的使用。
 
方法一
 
创建测试表
 
首先创建一个收入表,建表语句为:

CREATE TABLE IF NOT EXISTS `employee` (
 
  `id`     INT                  AUTO_INCREMENT PRIMARY KEY,
 
  `name`   VARCHAR(10) NOT NULL DEFAULT '',
 
  `income` INT         NOT NULL DEFAULT '0'
 
)
 
  ENGINE = InnoDB
 
  DEFAULT CHARSET = utf8;
 
INSERT INTO `employee` (`name`, `income`)
 
VALUES ('麻子', 20000);
 
INSERT INTO `employee` (`name`, `income`)
 
VALUES ('李四', 12000);
 
INSERT INTO `employee` (`name`, `income`)
 
VALUES ('张三', 10000);
 
INSERT INTO `employee` (`name`, `income`)
 
VALUES ('王二', 16000);
 
INSERT INTO `employee` (`name`, `income`)
 
VALUES ('土豪', 40000);
 
完成任务 1
 
将数据排序,并给每一行数据给出其在所有数据中的排名:
 
SELECT t1.name, t1.income, COUNT(*) AS rank
 
FROM employee AS t1,
 
     employee AS t2
 
WHERE t1.income < t2.income
 
   OR (t1.income = t2.income AND t1.name <= t2.name)
 
GROUP BY t1.name, t1.income
 
ORDER BY rank;
 
完成小任务 2
 
找出中位数的排名数字:
 
SELECT (COUNT(*) + 1) DIV 2 as rank
 
FROM employee;

完成小任务 3
 
SELECT income AS median
 
FROM (SELECT t1.name, t1.income, COUNT(*) AS rank
 
      FROM employee AS t1,
 
           employee AS t2
 
      WHERE t1.income < t2.income
 
         OR (t1.income = t2.income AND t1.name <= t2.name)
 
      GROUP BY t1.name, t1.income
 
      ORDER BY rank) t3
 
WHERE rank = (SELECT (COUNT(*) + 1) DIV 2 FROM employee)
 
至此,我们就找到了如何从一组数据中获得中位数的方法。
 
方法二
 
下面,来介绍另外一种优化排名语句的方法。
 
我们都知道如何给一组数据做排序操作,在本例中,实现方法如下:
 
SELECT name, income
 
FROM employee
 
ORDER BY income DESC
 
那我们可不可以更进一步,对查询出的结果加一列,这一列的数据为排名呢?
 
我们可以通过 3 个自定义变量的方法来实现这一目标:
 
第一个变量用来记录当前行数据的收入
 
第二个变量用来记录上一行数据的收入
 
第三个变量用来记录当前行数据的排名
 
SET @curr_income := 0;
 
SET @prev_income := 0;
 
SET @rank := 0;
 
SELECT `name`,
 
       @curr_income := income                                      AS income,
 
       @rank := if(@prev_income != @curr_income, @rank + 1, @rank) AS rank,
 
       @prev_income := @curr_income                                AS dummy
 
FROM employee
 
ORDER BY income DESC
 
然后再找出中位数的排名数字,进一步找出收入的中位数:
 
SET @curr_income := 0;
 
SET @prev_income := 0;
 
SET @rank := 0;
 
SELECT income AS median
 
FROM (SELECT `name`,
 
             @curr_income := income                                      AS income,
 
             @rank := if(@prev_income != @curr_income, @rank + 1, @rank) AS rank,
 
             @prev_income := @curr_income                                AS dummy
 
      FROM employee
 
      ORDER BY income DESC) AS t1
 
WHERE t1.rank = (SELECT (COUNT(*) + 1) DIV 2 FROM employee)
 

 

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章