Khoảng biến thiên
Định nghĩa:
Khoảng biến thiên (ký hiệu R) của mẫu số liệu ghép nhóm là hiệu số giữa đầu mút phải của nhóm cuối cùng và đầu mút trái của nhóm đầu tiên chứa dữ liệu.
Lưu ý:
- Với mẫu số liệu ghép nhóm như sau:
Nếu n1 và nk đều khác 0, thì R = uk+1 – u1.
- Khoảng biến thiên của mẫu số liệu ghép nhóm luôn lớn hơn hoặc bằng khoảng biến thiên của mẫu số liệu gốc.
Ví dụ: Mẫu số liệu ghi lại tốc độ của 42 ô tô (km/h):
Alt: Bảng tốc độ của 42 ô tô được ghép nhóm, dùng để tính khoảng biến thiên.
Khoảng biến thiên của mẫu số liệu này là R = 70 – 40 = 30.
Ý nghĩa:
- Khoảng biến thiên của mẫu số liệu ghép nhóm xấp xỉ khoảng biến thiên của mẫu số liệu gốc, dùng để đo mức độ phân tán của mẫu số liệu.
- Khoảng biến thiên R = uk+1 – u1 chưa phản ánh đầy đủ mức độ phân tán của số liệu, giá trị R có thể tăng mạnh khi có giá trị ngoại lệ. Vì vậy, cần sử dụng thêm các số đặc trưng khác để đánh giá phân tán.
Ví dụ: Thâm niên công tác của công nhân hai nhà máy A và B:
Thâm niên (năm) | [0; 5) | [5; 10) | [10; 15) | [15; 20) | [20; 25) |
---|---|---|---|---|---|
Nhà máy A | 35 | 13 | 12 | 12 | 8 |
Nhà máy B | 14 | 26 | 24 | 11 | 0 |
Khoảng biến thiên thâm niên nhà máy A: R1 = 25 – 0 = 25.
Khoảng biến thiên thâm niên nhà máy B: R2 = 20 – 0 = 20.
Vậy thâm niên công tác của công nhân nhà máy A phân tán hơn nhà máy B.
Khoảng tứ phân vị
Lưu ý: Tứ phân vị thứ i (Qi, i = 1, 2, 3) của mẫu số liệu ghép nhóm được xác định:
Qi = um + (in/4 – C) (um+1 – um) / nm
Trong đó:
- n = n1 + n2 + … + nk là cỡ mẫu.
- [um; um+1) là nhóm chứa tứ phân vị thứ i.
- nm là tần số của nhóm chứa tứ phân vị thứ i.
- C = n1 + n2 + … + nm-1.
Định nghĩa:
Khoảng tứ phân vị (ký hiệu ΔQ) là hiệu giữa tứ phân vị thứ ba (Q3) và tứ phân vị thứ nhất (Q1): ΔQ = Q3 – Q1.
Ví dụ: Mẫu số liệu ghi lại tốc độ của 42 ô tô (km/h):
Alt: Bảng tốc độ 42 ô tô được ghép nhóm, dùng để tính khoảng tứ phân vị.
Cỡ mẫu n = 42.
Q1 thuộc nhóm [45; 50), Q1 = 45 + (42/4 – 5) * (50 – 45) / 10 = 47,75.
Q3 thuộc nhóm [60; 65), Q3 = 60 + (423/4 – 31) (65 – 60) / 7 ≈ 60,36.
Khoảng tứ phân vị: ΔQ = 60,36 – 47,75 = 12,61.
Ý nghĩa:
- Khoảng tứ phân vị của mẫu số liệu ghép nhóm xấp xỉ khoảng tứ phân vị của mẫu số liệu gốc, đo mức độ phân tán của 50% số liệu nằm giữa mẫu số liệu.
- ΔQ càng nhỏ, dữ liệu càng tập trung quanh trung vị.
- ΔQ dùng để xác định giá trị ngoại lệ: x là ngoại lệ nếu x > Q3 + 1,5ΔQ hoặc x
- ΔQ ít bị ảnh hưởng bởi giá trị ngoại lệ.
Ví dụ: Điểm đánh giá mẫu áo khoác (thang điểm 100) của 40 người:
Alt: Bảng điểm đánh giá áo khoác của 40 người được ghép nhóm.
a) Khoảng biến thiên: 100 – 50 = 50.
b) Cỡ mẫu: 40.
Q1 thuộc nhóm [70; 80), Q1 = 70 + (40/4 – 9) * (80 – 70) / 23 = 1620/23.
Q3 thuộc nhóm [70; 80), Q3 = 70 + (403/4 – 9) (80 – 70) / 23 = 1820/23.
ΔQ = 1820/23 – 1620/23 ≈ 8,7.
c) Q1 – 1,5ΔQ ≈ 57,38 > 50, nên điểm 50 là giá trị ngoại lệ.
Nội dung được phát triển bởi đội ngũ Meraki Center với mục đích chia sẻ và tăng trải nghiệm khách hàng. Mọi ý kiến đóng góp xin vui lòng liên hệ tổng đài chăm sóc: 1900 0000 hoặc email: [email protected]