1. Trong thống kê mô tả, độ lệch chuẩn đo lường điều gì?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trừ giá trị nhỏ nhất
D. Vị trí trung tâm của dữ liệu
2. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy trở nên hẹp hơn
C. Khoảng tin cậy không thay đổi
D. Khoảng tin cậy dao động ngẫu nhiên
3. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm
B. Kiểm tra mối quan hệ giữa hai biến định tính
C. Dự đoán giá trị của một biến dựa trên biến khác
D. Đo lường mức độ phân tán của dữ liệu
4. Trong thống kê, 'bậc tự do' (degrees of freedom) thường liên quan đến điều gì?
A. Tổng số quan sát trong dữ liệu
B. Số lượng biến trong mô hình
C. Số lượng giá trị trong dữ liệu có thể tự do biến đổi sau khi một số ràng buộc được áp đặt
D. Mức ý nghĩa thống kê
5. Khi nào thì mẫu ghép cặp (paired samples) được sử dụng?
A. Khi so sánh trung bình của hai quần thể độc lập
B. Khi so sánh trung bình của cùng một nhóm đối tượng trước và sau can thiệp
C. Khi muốn lấy mẫu ngẫu nhiên đơn giản
D. Khi muốn phân tầng mẫu
6. Điều gì xảy ra với sai số loại II (Type II error) khi tăng kích thước mẫu, giả sử các yếu tố khác không đổi?
A. Sai số loại II tăng lên
B. Sai số loại II giảm xuống
C. Sai số loại II không thay đổi
D. Sai số loại II dao động ngẫu nhiên
7. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối gì?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối Gaussian
D. Phân phối đều
8. Giá trị 'mode' (mốt) là gì?
A. Giá trị trung bình của dữ liệu
B. Giá trị trung vị của dữ liệu
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
D. Giá trị nhỏ nhất trong tập dữ liệu
9. Giá trị p trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng
B. Ngưỡng ý nghĩa thống kê
C. Xác suất quan sát được kết quảExtreme như vậy (hoặc hơn) nếu giả thuyết null là đúng
D. Kích thước của hiệu ứng
10. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì về phân phối của trung bình mẫu?
A. Phân phối của trung bình mẫu luôn là phân phối chuẩn
B. Phân phối của trung bình mẫu tiến gần đến phân phối chuẩn khi kích thước mẫu tăng lên, bất kể dạng phân phối gốc của quần thể
C. Phân phối của trung bình mẫu giống hệt phân phối của quần thể
D. Phân phối của trung bình mẫu là phân phối nhị thức
11. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sự khác biệt giữa hai biến
B. Mức độ phụ thuộc lẫn nhau của hai biến
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
D. Quan hệ phi tuyến tính giữa hai biến
12. Mục đích chính của thống kê suy diễn là gì?
A. Tóm tắt và mô tả dữ liệu
B. Thu thập dữ liệu
C. Đưa ra kết luận hoặc dự đoán về quần thể dựa trên mẫu
D. Trình bày dữ liệu bằng đồ thị
13. Phương pháp lấy mẫu phân tầng (Stratified sampling) được sử dụng khi nào?
A. Khi quần thể rất đồng nhất
B. Khi muốn đảm bảo đại diện từ các nhóm con khác nhau trong quần thể
C. Khi không có danh sách đầy đủ về quần thể
D. Khi chi phí thu thập dữ liệu rất thấp
14. Phương pháp thống kê nào thường được sử dụng để dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập?
A. Thống kê mô tả
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
15. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự sai
B. Không bác bỏ giả thuyết null khi nó thực sự đúng
C. Bác bỏ giả thuyết null khi nó thực sự đúng
D. Không bác bỏ giả thuyết null khi nó thực sự sai
16. Giá trị trung vị (Median) là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị ở giữa của tập dữ liệu đã được sắp xếp
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
D. Tổng của tất cả các giá trị chia cho số lượng giá trị
17. Ưu điểm chính của việc sử dụng thống kê phi tham số (non-parametric statistics) là gì?
A. Mạnh mẽ hơn thống kê tham số
B. Yêu cầu ít giả định hơn về phân phối dữ liệu
C. Luôn cho kết quả chính xác hơn
D. Dễ tính toán hơn
18. Thang đo nào sau đây cho phép sắp xếp thứ tự các đối tượng và xác định khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 thực sự?
A. Định danh
B. Thứ bậc
C. Khoảng
D. Tỷ lệ
19. Mô tả nào sau đây là đúng về 'phân phối lệch phải' (right-skewed distribution)?
A. Đuôi dài hơn về phía bên trái
B. Đối xứng xung quanh giá trị trung bình
C. Đuôi dài hơn về phía bên phải
D. Có hai đỉnh rõ rệt
20. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Ở cả hai đuôi của phân phối
B. Chỉ ở đuôi bên phải của phân phối
C. Chỉ ở đuôi bên trái của phân phối
D. Hoặc chỉ ở đuôi bên phải hoặc chỉ ở đuôi bên trái của phân phối, tùy thuộc vào giả thuyết đối
21. Phương pháp chọn mẫu nào đảm bảo rằng mọi đơn vị trong quần thể đều có cơ hội được chọn như nhau?
A. Mẫu thuận tiện
B. Mẫu phân tầng
C. Mẫu ngẫu nhiên đơn giản
D. Mẫu cụm
22. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Trung bình của tất cả các nhóm là khác nhau
B. Ít nhất một trung bình nhóm khác với các nhóm khác
C. Trung bình của tất cả các nhóm là bằng nhau
D. Phương sai của tất cả các nhóm là khác nhau
23. Trong phân tích hồi quy, hệ số xác định (R-squared) biểu thị điều gì?
A. Độ mạnh của mối quan hệ tuyến tính
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình
C. Độ dốc của đường hồi quy
D. Sai số chuẩn của mô hình
24. Loại biểu đồ nào phù hợp nhất để thể hiện tần suất của các danh mục khác nhau trong dữ liệu định tính?
A. Biểu đồ phân tán
B. Biểu đồ đường
C. Biểu đồ cột
D. Biểu đồ hộp
25. Giá trị ngoại lệ (Outlier) là gì trong thống kê?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu
C. Giá trị dữ liệu nằm ngoài phạm vi của hầu hết các giá trị khác trong tập dữ liệu
D. Giá trị nằm ở giữa tập dữ liệu khi được sắp xếp
26. Hệ số tương quan có giá trị là -0.9 cho thấy điều gì?
A. Mối quan hệ tuyến tính mạnh mẽ và dương
B. Mối quan hệ tuyến tính yếu và dương
C. Mối quan hệ tuyến tính mạnh mẽ và âm
D. Không có mối quan hệ tuyến tính
27. Mức ý nghĩa (alpha, α) thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.1
B. 0.05
C. 0.5
D. 1.0
28. Biến định tính (Qualitative variable) còn được gọi là biến gì?
A. Biến số
B. Biến liên tục
C. Biến phân loại
D. Biến rời rạc
29. Phương sai (Variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình (bình phương độ lệch chuẩn)
C. Giá trị trung vị của dữ liệu
D. Giá trị xuất hiện nhiều nhất trong dữ liệu
30. Sai số chuẩn (Standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể
B. Độ lệch chuẩn của mẫu
C. Mức độ biến động của trung bình mẫu từ mẫu này sang mẫu khác
D. Giá trị trung bình của quần thể