1. Điều gì KHÔNG phải là ưu điểm của việc sử dụng mẫu (sample) thay vì tổng thể (population) trong nghiên cứu thống kê?
A. Tiết kiệm chi phí.
B. Tiết kiệm thời gian.
C. Độ chính xác luôn cao hơn.
D. Tính khả thi cao hơn với tổng thể lớn.
2. Biến định tính (Qualitative variable) được chia thành mấy loại chính?
A. Một loại.
B. Hai loại.
C. Ba loại.
D. Bốn loại.
3. Loại biểu đồ nào KHÔNG phù hợp để thể hiện phân phối tần số của biến định lượng liên tục?
A. Biểu đồ tần suất (Histogram).
B. Biểu đồ hộp (Box plot).
C. Biểu đồ cột (Bar chart).
D. Đường cong tần suất.
4. Trong kiểm định giả thuyết thống kê, khi bác bỏ giả thuyếtNull (H0) mặc dù nó đúng, ta mắc phải loại sai lầm nào?
A. Sai lầm loại I.
B. Sai lầm loại II.
C. Sai lầm hệ thống.
D. Sai lầm ngẫu nhiên.
5. Trong phân tích ANOVA, giả thuyết Null (H0) thường là gì?
A. Tất cả các trung bình nhóm đều khác nhau.
B. Ít nhất một trung bình nhóm khác với các nhóm còn lại.
C. Tất cả các trung bình nhóm đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm.
6. Giá trị P (P-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết Null là đúng.
B. Xác suất quan sát được kết quả cực đoan như mẫu, giả định Null là đúng.
C. Mức độ quan trọng thực tế của kết quả.
D. Xác suất sai lầm loại II.
7. Độ lệch chuẩn (Standard deviation) đo lường điều gì về một tập dữ liệu?
A. Xu hướng trung tâm của dữ liệu.
B. Hình dạng phân phối của dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Vị trí trung vị của dữ liệu.
8. Chọn câu phát biểu ĐÚNG về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối lệch phải (right-skewed distribution).
A. Trung bình = Trung vị = Mốt.
B. Trung bình < Trung vị < Mốt.
C. Mốt < Trung vị < Trung bình.
D. Trung vị < Mốt < Trung bình.
9. Phương pháp lấy mẫu nào đảm bảo mọi đơn vị trong tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu phân tầng (Stratified sampling).
B. Lấy mẫu cụm (Cluster sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu thuận tiện (Convenience sampling).
10. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối đều.
11. Điều gì xảy ra với độ rộng của khoảng tin cậy khi mức độ tin cậy (confidence level) tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng khoảng tin cậy giảm xuống.
B. Độ rộng khoảng tin cậy tăng lên.
C. Độ rộng khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
12. Trong phân tích hồi quy đa biến, hệ số hồi quy riêng phần (partial regression coefficient) cho biết điều gì?
A. Mức độ quan hệ tuyến tính giữa tất cả các biến độc lập và biến phụ thuộc.
B. Mức độ thay đổi của biến phụ thuộc khi một biến độc lập thay đổi một đơn vị, giữ các biến độc lập khác không đổi.
C. Mức độ tương quan giữa các biến độc lập.
D. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình.
13. Đại lượng nào sau đây KHÔNG phải là một độ đo xu hướng trung tâm?
A. Trung bình (Mean).
B. Trung vị (Median).
C. Độ lệch chuẩn (Standard Deviation).
D. Mốt (Mode).
14. Hệ số tương quan (correlation coefficient) đo lường điều gì giữa hai biến định lượng?
A. Sự khác biệt giữa giá trị trung bình của hai biến.
B. Mức độ và chiều hướng của mối quan hệ tuyến tính.
C. Mối quan hệ nhân quả giữa hai biến.
D. Tỷ lệ phương sai chung của hai biến.
15. Mức đo lường nào cho phép thực hiện phép tính tỉ lệ (ratio) một cách có ý nghĩa?
A. Mức danh nghĩa (Nominal).
B. Mức thứ bậc (Ordinal).
C. Mức khoảng (Interval).
D. Mức tỉ lệ (Ratio).
16. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) α thường được chọn là bao nhiêu?
A. 0.1.
B. 0.05.
C. 0.5.
D. 1.0.
17. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Mức độ phân tán của dữ liệu.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
D. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
18. Khi thực hiện kiểm định một đuôi (one-tailed test) thay vì kiểm định hai đuôi (two-tailed test), điều gì thay đổi?
A. Giá trị thống kê kiểm định (test statistic).
B. Giá trị P (P-value).
C. Mức ý nghĩa α.
D. Quyết định kiểm định (bác bỏ hay chấp nhận H0).
19. Chọn phát biểu SAI về sai số loại II (Type II error).
A. Sai số loại II xảy ra khi chấp nhận giả thuyết Null (H0) sai.
B. Xác suất mắc sai số loại II được ký hiệu là β.
C. Tăng kích thước mẫu thường làm giảm nguy cơ mắc sai số loại II.
D. Sai số loại II nghiêm trọng hơn sai số loại I trong mọi trường hợp.
20. Khoảng tin cậy (Confidence interval) được sử dụng để ước lượng điều gì?
A. Giá trị của thống kê mẫu.
B. Giá trị của tham số tổng thể.
C. Độ lệch chuẩn của mẫu.
D. Kích thước mẫu cần thiết.
21. Khái niệm 'phương sai' (variance) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu.
B. Độ lệch tuyệt đối trung bình.
C. Trung bình của bình phương độ lệch so với giá trị trung bình.
D. Phạm vi của dữ liệu.
22. Thống kê mô tả KHÔNG tập trung vào hoạt động nào sau đây?
A. Thu thập dữ liệu.
B. Tóm tắt dữ liệu.
C. Trình bày dữ liệu.
D. Ước lượng tham số tổng thể.
23. Đặc điểm nào sau đây KHÔNG thuộc về phân phối chuẩn?
A. Đối xứng qua giá trị trung bình.
B. Hình chuông.
C. Hai đỉnh.
D. Diện tích dưới đường cong bằng 1.
24. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với sai số chuẩn (standard error) của trung bình mẫu?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không đổi.
D. Sai số chuẩn biến động không dự đoán được.
25. Điều gì KHÔNG phải là một đặc điểm của 'mẫu đại diện' (representative sample)?
A. Phản ánh đúng đặc điểm của tổng thể.
B. Được chọn bằng phương pháp ngẫu nhiên.
C. Luôn có kích thước rất lớn.
D. Giảm thiểu sai lệch mẫu.
26. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả đặc điểm của mẫu.
B. Tổng hợp dữ liệu.
C. Rút ra kết luận về tổng thể dựa trên mẫu.
D. Trực quan hóa dữ liệu.
27. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics) thay vì thống kê tham số (parametric statistics)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu rất lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi muốn ước lượng tham số tổng thể.
28. Phân phối chuẩn (Normal distribution) còn được gọi bằng tên gọi nào khác?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối Gaussian.
D. Phân phối mũ.
29. Phương pháp thống kê nào thường được sử dụng để so sánh trung bình của hai nhóm độc lập?
A. Phân tích phương sai (ANOVA).
B. Kiểm định t độc lập (Independent samples t-test).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-bình phương.
30. Biến ngẫu nhiên rời rạc (discrete random variable) là biến có đặc điểm gì?
A. Giá trị có thể nhận bất kỳ giá trị nào trong một khoảng liên tục.
B. Giá trị chỉ có thể nhận một số hữu hạn giá trị hoặc vô hạn đếm được.
C. Giá trị luôn là số nguyên.
D. Giá trị không thể đo lường được.