1. Bài giảng: Mẫu số liệu ghép nhóm
Mẫu số liệu ghép nhóm
1. Số liệu ghép nhóm
- Mẫu số liệu ghép nhóm thường được trình bày dưới dạng bảng thống kê có dạng như sau:
- Bảng 1: Bảng tần số ghép nhóm
| Nhóm |
[u1;u2) |
[u2;u3) |
… |
[uk;uk+1) |
| Tần số |
n1 |
n2 |
… |
nk |
- Bảng trên gồm k nhóm [uj;uj+1) với 1≤j≤k, mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định.
- Cỡ mẫu n=n1+n2+…+nk.
- Giá trị chính giữa mỗi nhóm được dùng làm giá trị đại diện cho nhóm ấy.
Ví dụ: Nhóm [u1;u2) có giá trị đại diện là 21(u1+u2).
| Khoảng tuổi | [20;30) | [30;40) | [40;50) | [50;60) | [60;70) |
| Số khách hàng nữ | 3 | ? | ? | ? | ? |
- Hiệu uj+1−uj được gọi là độ dài của nhóm [uj;uj+1).
2. Số trung bình
| Nhóm | Nhóm 1 | Nhóm 2 | … | Nhóm k |
| Giá trị đại diện |
c1 |
c2 |
⋯ |
ck |
| Tần số |
n1 |
n2 |
⋯ |
nk |
- Số trung bình của mẫu số liệu ghép nhóm kí hiệu là x được tính như sau:
x=nn1c1+…+nkck
Trong đó, n=n1+…+nk là cỡ mẫu.
- Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc.
- Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.
3. Mốt
- Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.
- Giả sử nhóm chứa mốt là [um;um+1), khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là Mo, được xác định bởi công thức
Mo=um+(nm−nm−1)+(nm−nm+1)nm−nm−1⋅(um+1−um)
- Nếu không có nhóm kề trước của nhóm chứa mốt thì nm−1=0.
- Nếu không có nhóm kề sau của nhóm chứa mốt thì nm+1=0.
- Mốt của mẫu số liệu không ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mẫu. Mốt của mẫu số liệu sau khi ghép nhóm Mo xấp xỉ với mốt của mẫu số liệu không ghép nhóm.
- Các giá trị nằm xung quanh Mo thường có khả năng xuất hiện cao hơn các giá trị khác.
- Một mẫu số liệu ghép nhóm có thể có nhiều nhóm chứa mốt và nhiều mốt.
4. Trung vị
- Công thức xác định trung vị của mẫu số liệu ghép nhóm:
- Gọi n là cỡ mẫu.
- Giả sử đó là nhóm thứ p:[um;um+1).
- nm là tần số của nhóm chứa trung vị.
- C=n1+n2+…+nm−1.
- Khi đó trung vị là:
Me=um+nm2n−C⋅(um+1−um)
Từ dữ liệu ghép nhóm nói chung không thể xác định chính xác trung vị của mẫu số liệu gốc. Trung vị của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho mẫu số liệu gốc và có thể lấy làm giá trị đại diện cho mẫu số liệu.
5. Tứ phân vị
- Để tính tứ phân vị thứ nhất Q1 của mẫu số liệu ghép nhóm, ta làm như sau:
- Giả sử nhóm chứa Q1 là nhóm [um;um+1).
- nm là tần số của nhóm chứa phân vị thứ nhất.
- C=n1+n2+…+nm−1.
Q1=um+nm4n−C⋅(um+1−um)
- Để tính tứ phân vị thứ ba Q3 của mẫu số liệu ghép nhóm, ta làm như sau:
- Giả sử nhóm chứa Q3 là nhóm [uj;uj+1)
- nj là tần số của nhóm chứa phân vị thứ nhất.
- C=n1+n2+…+nj−1.
Q3=uj+nj43n−C⋅(uj+1−uj)
- Tứ phân vị thứ hai Q2 chính là trung vị Me.
- Nếu tứ phân vị thứ k là 21(xm+xm+1) , trong đó xm và xm+1 thuộc hai nhóm liên tiếp thì ta lấy Qk=uj.
- Bộ ba tứ phân vị của mẫu số liệu ghép nhóm là giá tị xấp xỉ cho tứ phân vị của mẫu số liệu gốc và được sử dụng làm giá trị đo xu thế trung tâm của mẫu số liệu.
2. Ví dụ minh hoạ: Mẫu số liệu ghép nhóm
Ví dụ 1:
Thống kê số giờ tự học của học sinh tại một trường THPT trong một tuần, người ta ghi được kết quả sau (đơn vị: giờ).

Hãy tổng hợp kết quả tự học của học sinh vào bảng tần số ghép nhóm có 5 nhóm và nhóm đầu tiên là [12,5;14,5) . Độ dài của mỗi nhóm là:
Lời giải:
|
Giờ tự học |
[12,5;14,5) |
[14,5;16,5) |
[16,5;18,5) |
[18,5;20,5) |
[20,5;22,5) |
|
Độ dài |
2 |
2 |
2 |
2 |
2 |
Ví dụ 2:
Kết quả điều tra chiều cao của học sinh trong trường THPT được biểu diễn ở biểu đồ dưới đây.

Cỡ mẫu của mẫu số liệu ghép nhóm trên là bao nhiêu?
Lời giải:
Cỡ mẫu của mẫu số liệu ghép nhóm trên là 3+5+6+9+12=35 .
3. Luyện tập củng cố: Mẫu số liệu ghép nhóm
Học đi đôi với hành, luyện tập hàng ngày để trở nên thông thái
Luyện tập ngay