IT 소스/MariaDB

[MariaDB] VARIANCE - 분산 함수

한량이야기 2024. 3. 7. 11:16
반응형

안녕하세요. 경제적, 시간적 자유를 꿈꾸는 한량입니다.

VARIANCE - 분산 함수

MariaDB의 분산 함수 - VARIANCE()

VARIANCE() 함수는 통계 함수 중 하나로 주어진

데이터의 분산 값을 계산하는 데 사용됩니다.

 

'분산'은 데이터의 흩어진 정도를 나타내는 통계적 지표로, 

값들이 평균에서 얼마나 떨어져 있는지를 측정합니다.

작은 분산은 데이터가 평균 주위에 모여 있음을 나타내며, 

데이터의 분포가 일정하다는 것을 의미합니다. 

반면에 큰 분산은 데이터가 평균에서 멀리 흩어져 있음을 나타내며, 

데이터의 분포가 불규칙하고 다양하다는 것을 의미합니다.

 

예문 테이블을 가지고 분산 함수가 어떻게 동작하는지 알아보겠습니다.

-- 테이블 생성 쿼리
CREATE TABLE employees (
    employee_id INT AUTO_INCREMENT PRIMARY KEY,
    employee_name VARCHAR(50),
    department VARCHAR(50),
    salary DECIMAL(10, 2)
);

-- 기본 데이터 삽입 쿼리
INSERT INTO employees 
  (employee_name, department, salary) 
VALUES
  ('홍길동', '인사부', 50000.00),
  ('김철수', '영업부', 60000.00),
  ('이영희', '개발부', 70000.00),
  ('박민수', '인사부', 55000.00),
  ('정수진', '영업부', 62000.00),
  ('최영미', '개발부', 72000.00),
  ('이철민', '영업부', 58000.00),
  ('김지은', '인사부', 53000.00),
  ('박영호', '개발부', 69000.00),
  ('최미나', '영업부', 61000.00);

 

아래의 SQL 쿼리는 직원들의 급여의 분산을 계산합니다.

-- 직원 급여로 분산 구하기
SELECT VARIANCE(salary) AS salary_variance FROM employees;

 

쿼리를 실행하면 49,800,000이라는 값을 얻을 수 있습니다.

분산 함수 쿼리 실형 결과 값

 

분산 함수를 사용하여 값들이 평균에서 얼마나 떨어져 있는지를 측정할 수 있습니다.

반응형