Skip to Content
Cấp 3 (Lớp 10-12)Lớp 10Chương 6: Thống kê

Chương 6: Thống kê

Ý nghĩa các số thống kê:

Số đặc trưngTrả lời câu hỏiVí dụ
Trung bình (xˉ\bar{x})Giá trị “đại diện” là gì?Điểm TB lớp: 7.5
Phương sai (s2s^2)Dữ liệu phân tán như thế nào?s2s^2 lớn = điểm chênh lệch nhiều
Độ lệch chuẩn (ss)Khoảng dao động quanh TB?s=1.2s = 1.2 → đa số điểm trong xˉ±1.2\bar{x} \pm 1.2
Mốt (Mo)Giá trị nào phổ biến nhất?Mốt = 8 → điểm 8 nhiều nhất
Trung vị (Me)Giá trị ở giữa?Me = 7 → 50% điểm ≥ 7

Mục tiêu học tập

Sau khi hoàn thành chương này, bạn sẽ:

  • Hiểu các khái niệm cơ bản về thống kê
  • Tính toán các đại lượng đặc trưng: trung bình, phương sai, độ lệch chuẩn
  • Biết cách đọc và lập bảng tần số, biểu đồ

Phần 1: Các khái niệm cơ bản

1.1. Dữ liệu thống kê

Dữ liệu (data) là tập hợp các con số, sự kiện được thu thập từ quan sát hoặc đo đạc.

Tần số (frequency): Số lần xuất hiện của một giá trị trong mẫu dữ liệu.

Tần suất (relative frequency): Tỉ lệ phần trăm của tần số so với tổng số dữ liệu.

Taˆˋn suaˆˊt=Taˆˋn soˆˊTổng soˆˊ dữ liệu×100%\text{Tần suất} = \frac{\text{Tần số}}{\text{Tổng số dữ liệu}} \times 100\%


1.2. Bảng phân bố tần số

Bảng phân bố tần số được lập như sau:

Giá trị (xix_i)x1x_1x2x_2xkx_kTổng
Tần số (nin_i)n1n_1n2n_2nkn_knn
Tần suất (fif_i)f1f_1f2f_2fkf_k100%

Phần 2: Các số đặc trưng của mẫu số liệu

2.1. Số trung bình cộng (Mean)

Định nghĩa: Trung bình cộng của mẫu số liệu là:

xˉ=x1+x2+...+xnn=1ni=1nxi\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n} = \frac{1}{n} \sum_{i=1}^{n} x_i

Với bảng tần số:

xˉ=n1x1+n2x2+...+nkxkn=i=1knixin\bar{x} = \frac{n_1 x_1 + n_2 x_2 + ... + n_k x_k}{n} = \frac{\sum_{i=1}^{k} n_i x_i}{n}


2.2. Trung vị (Median)

Định nghĩa: Trung vị MeM_e là giá trị ở vị trí chính giữa khi sắp xếp dữ liệu theo thứ tự tăng dần.

Cách tính:

  • Nếu nn lẻ: Me=x(n+1)/2M_e = x_{(n+1)/2}
  • Nếu nn chẵn: Me=xn/2+xn/2+12M_e = \frac{x_{n/2} + x_{n/2+1}}{2}

2.3. Mốt (Mode)

Định nghĩa: Mốt MoM_o là giá trị xuất hiện nhiều lần nhất trong mẫu số liệu.

Lưu ý: Một mẫu có thể có nhiều mốt hoặc không có mốt (khi tất cả giá trị xuất hiện như nhau).


2.4. Phương sai (Variance)

Định nghĩa: Phương sai s2s^2 đo mức độ phân tán của dữ liệu quanh giá trị trung bình:

s2=1ni=1n(xixˉ)2s^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

Với bảng tần số:

s2=1ni=1kni(xixˉ)2s^2 = \frac{1}{n} \sum_{i=1}^{k} n_i (x_i - \bar{x})^2

Công thức tính nhanh:

s2=1ni=1nxi2xˉ2=x2xˉ2s^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 - \bar{x}^2 = \overline{x^2} - \bar{x}^2


2.5. Độ lệch chuẩn (Standard Deviation)

Định nghĩa: Độ lệch chuẩn ss là căn bậc hai của phương sai:

s=s2s = \sqrt{s^2}

Ý nghĩa thống kê:

  • Phương sai/độ lệch chuẩn nhỏ: Dữ liệu tập trung gần giá trị trung bình
  • Phương sai/độ lệch chuẩn lớn: Dữ liệu phân tán xa giá trị trung bình

Lỗi thường gặp với thống kê:

  1. Nhầm trung bình = trung điểm: xˉ=xin\bar{x} = \frac{\sum x_i}{n}, NOT xmin+xmax2\frac{x_{min} + x_{max}}{2}
  2. Khi cộng hằng số c: xˉmi=xˉ+c\bar{x}_{mới} = \bar{x} + c, nhưng smi2=s2s^2_{mới} = s^2 (phương sai KHÔNG ĐỔI!)
  3. Khi nhân hằng số k: xˉmoˊi=kxˉ\bar{x}_{mói} = k\bar{x}, và smi2=k2s2s^2_{mới} = k^2 s^2 (phương sai nhân k2k^2!)

Phần 3: Biểu đồ thống kê

3.1. Biểu đồ cột (Bar chart)

Dùng để so sánh các giá trị rời rạc. Chiều cao cột tỉ lệ với tần số/tần suất.

3.2. Biểu đồ tần suất hình quạt (Pie chart)

Dùng để thể hiện tỉ lệ phần trăm. Góc của mỗi phần tỉ lệ với tần suất.

Goˊc phaˆˋi=fi×360°\text{Góc phần } i = f_i \times 360°

3.3. Đường gấp khúc tần số

Biểu diễn sự biến đổi của tần số theo giá trị dữ liệu.

Hình minh họa biểu đồ cột tần số:

Tần sốĐiểm24685466788894Biểu đồ cột tần số điểm kiểm tra

Giải thích: Biểu đồ cột thể hiện trực quan tần số của mỗi giá trị. Chiều cao cột tỉ lệ với số lần xuất hiện. Đây là công cụ quan trọng để visualize phân phối dữ liệu.

Hình minh họa phân phối chuẩn:

μ (trung bình)μ-σμ+σ68.27%Phân phối chuẩn (Normal Distribution)σ = độ lệch chuẩn

Giải thích: Phân phối chuẩn (hình chuông) có tính chất: 68.27% dữ liệu nằm trong khoảng μ ± σ, 95.45% trong μ ± 2σ, và 99.73% trong μ ± 3σ.


Bài tập mẫu có lời giải

Bài 1: Lập bảng phân bố tần số

Đề bài: Điểm thi của 30 học sinh như sau:

5, 7, 8, 6, 9, 7, 8, 5, 6, 7, 8, 9, 6, 7, 8, 5, 6, 7, 8, 9, 6, 7, 5, 8, 7, 6, 8, 9, 7, 8

Lập bảng phân bố tần số, tần suất.

Lời giải chi tiết:

Nhắc lại:

  • Tần số (nin_i): Số lần xuất hiện của giá trị
  • Tần suất (fif_i): fi=nin×100%f_i = \frac{n_i}{n} \times 100\%

Bước 1: Đếm tần số mỗi điểm

Điểm56789
Đếm//////////////////////////////
Tần số46884

Lý do: Đếm từng giá trị trong dữ liệu, ghi vạch (tally marks) để dễ theo dõi.

Bước 2: Tính tần suất

fi=ni30×100%f_i = \frac{n_i}{30} \times 100\%

Bước 3: Lập bảng hoàn chỉnh

Điểm (xix_i)56789Tổng
Tần số (nin_i)4688430
Tần suất (fif_i)13.3%20%26.7%26.7%13.3%100%

Kiểm tra: Tổng tần số = 4+6+8+8+4=304+6+8+8+4 = 30 ✓. Tổng tần suất = 100% ✓


Bài 2: Tính các đại lượng đặc trưng

Đề bài: Với dữ liệu ở Bài 1, tính:

a) Số trung bình cộng

b) Trung vị

c) Mốt

d) Phương sai và độ lệch chuẩn

Lời giải chi tiết:

Nhắc lại công thức:

  • Trung bình: xˉ=nixin\bar{x} = \frac{\sum n_i x_i}{n}
  • Phương sai: s2=x2xˉ2s^2 = \overline{x^2} - \bar{x}^2

a) Số trung bình:

Bước 1: Tính tổng nixi\sum n_i x_i nixi=45+66+87+88+49\sum n_i x_i = 4 \cdot 5 + 6 \cdot 6 + 8 \cdot 7 + 8 \cdot 8 + 4 \cdot 9 =20+36+56+64+36=212= 20 + 36 + 56 + 64 + 36 = 212

Bước 2: Chia cho tổng số xˉ=212307.07\bar{x} = \frac{212}{30} \approx 7.07

Lý do: Trung bình = tổng tất cả giá trị / số lượng.

b) Trung vị:

Bước 1: Xác định vị trí trung vị

  • n=30n = 30 (chẵn), nên Me=x15+x162M_e = \frac{x_{15} + x_{16}}{2}

Bước 2: Đếm vị trí tích lũy

Vị trí1-45-1011-1819-2627-30
Điểm56789

Lý do: Vị trí 15 và 16 đều nằm trong khoảng 11-18 (tần số tích lũy: 4+6+8=18).

Me=7+72=7M_e = \frac{7 + 7}{2} = 7

c) Mốt:

Giá trị xuất hiện nhiều nhất: 7 và 8 (đều 8 lần)

Mo=7 vaˋ Mo=8M_o = 7 \text{ và } M_o = 8 (mẫu có 2 mốt - bimodal)

d) Phương sai:

Bước 1: Tính x2\overline{x^2} x2=425+636+849+864+48130\overline{x^2} = \frac{4 \cdot 25 + 6 \cdot 36 + 8 \cdot 49 + 8 \cdot 64 + 4 \cdot 81}{30} =100+216+392+512+32430=15443051.47= \frac{100 + 216 + 392 + 512 + 324}{30} = \frac{1544}{30} \approx 51.47

Bước 2: Áp dụng công thức s2=x2xˉ2=51.47(7.07)2=51.4749.98=1.49s^2 = \overline{x^2} - \bar{x}^2 = 51.47 - (7.07)^2 = 51.47 - 49.98 = 1.49

Lý do: Công thức tính nhanh: s2=E(X2)[E(X)]2s^2 = E(X^2) - [E(X)]^2.

Độ lệch chuẩn: s=1.491.22s = \sqrt{1.49} \approx 1.22

Ý nghĩa: Đa số điểm nằm trong khoảng xˉ±s=7.07±1.22=[5.85,8.29]\bar{x} \pm s = 7.07 \pm 1.22 = [5.85, 8.29].


Bài 3: Bài toán về dữ liệu ghép lớp

Đề bài: Khối lượng (kg) của 40 bao gạo được phân vào các lớp:

Lớp (kg)[48, 50)[50, 52)[52, 54)[54, 56)[56, 58]
Tần số5101582

Tìm số trung bình.

Lời giải chi tiết:

Nhắc lại: Với dữ liệu ghép lớp, dùng giá trị đại diện = trung điểm của mỗi lớp.

Bước 1: Tính giá trị đại diện của mỗi lớp

Lớp[48, 50)[50, 52)[52, 54)[54, 56)[56, 58]
Trung điểm48+502=49\frac{48+50}{2}=4950+522=51\frac{50+52}{2}=5152+542=53\frac{52+54}{2}=5354+562=55\frac{54+56}{2}=5556+582=57\frac{56+58}{2}=57
Tần số5101582

Lý do: Dùng trung điểm vì các giá trị trong lớp được giả sử phân bố đều.

Bước 2: Tính tổng nixi\sum n_i x_i nixi=549+1051+1553+855+257\sum n_i x_i = 5 \cdot 49 + 10 \cdot 51 + 15 \cdot 53 + 8 \cdot 55 + 2 \cdot 57 =245+510+795+440+114=2104= 245 + 510 + 795 + 440 + 114 = 2104

Bước 3: Tính trung bình xˉ=210440=52.6 kg\bar{x} = \frac{2104}{40} = 52.6 \text{ kg}

Kiểm tra ước lượng: Trung bình nằm trong lớp [52, 54) có tần số cao nhất (15) ✓


Bài tập tự luyện

Bài 1

Điểm kiểm tra của 20 học sinh: 4, 5, 6, 7, 8, 5, 6, 7, 8, 9, 6, 7, 7, 8, 8, 9, 5, 6, 7, 8

a) Lập bảng phân bố tần số, tần suất

b) Tính số trung bình, trung vị, mốt

c) Vẽ biểu đồ cột tần số

Bài 2

Số sản phẩm mỗi ngày của công nhân trong 30 ngày:

Số sản phẩm454647484950
Số ngày258942

a) Tính năng suất trung bình

b) Tính phương sai và độ lệch chuẩn

Bài 3

Cho dữ liệu có số trung bình là 50 và phương sai là 16.

a) Tính độ lệch chuẩn

b) Nếu tăng mỗi giá trị trong mẫu thêm 5, số trung bình và phương sai mới là bao nhiêu?

c) Nếu nhân mỗi giá trị trong mẫu với 2, số trung bình và phương sai mới là bao nhiêu?


Tóm tắt

Công thức quan trọng

Công thứcÝ nghĩa
xˉ=xifin\bar{x} = \frac{\sum x_i f_i}{n}Số trung bình (có tần số)
S2=(xixˉ)2finS^2 = \frac{\sum (x_i - \bar{x})^2 f_i}{n}Phương sai
S=S2S = \sqrt{S^2}Độ lệch chuẩn
MốtGiá trị có tần số lớn nhất
Trung vịGiá trị ở vị trí giữa (khi sắp thứ tự)

Key Points

  • Số trung bình: Tổng chia số lượng
  • Phương sai: Đo độ phân tán quanh trung bình
  • Độ lệch chuẩn: Căn bậc 2 của phương sai
  • Lưu ý: Trung vị ≠ Trung bình (khác nhau khi có outliers)

Lỗi thường gặp và cách tránh:

SaiĐúngGiải thích
Trung bình = (xmin + xmax)/2Trung bình = xin\frac{\sum x_i}{n}Nhầm với trung điểm
Phương sai có thể âmPhương sai 0\geq 0Bình phương luôn dương
Độ lệch chuẩn = Phương saiS=S2S = \sqrt{S^2}ĐLC là căn của PS
Mốt là giá trị nhỏ nhấtMốt = giá trị xuất hiện nhiều nhấtNhầm khái niệm

Mẹo nhớ:

  • Số trung bình: “Tổng chia số”
  • Phương sai: “Bình phương độ chênh lệch”
  • Mốt: “Mode = Most frequent”

Hoàn thành chương 5! Chuyển sang Chương 6: Vector

Last updated on