1. Khái niệm 'phương sai′ (Variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị trung vị của dữ liệu.
C. Độ phân tán trung bình của dữ liệu xung quanh giá trị trung bình.
D. Giá trị xuất hiện nhiều nhất trong dữ liệu.
2. Trung vị (Median) là giá trị ở vị trí nào trong một tập dữ liệu đã sắp xếp?
A. Vị trí đầu tiên
B. Vị trí cuối cùng
C. Vị trí giữa
D. Vị trí có tần số xuất hiện nhiều nhất
3. Biến số nào sau đây là biến định lượng liên tục?
A. Số con trong gia đình.
B. Màu sắc yêu thích.
C. Chiều cao của một người.
D. Thứ hạng trong cuộc thi.
4. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Khoảng tứ phân vị
5. Kiểm định Chi-bình phương thường được sử dụng để kiểm tra điều gì?
A. Sự khác biệt giữa trung bình của hai nhóm.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự độc lập giữa hai biến định tính.
D. Độ phân tán của dữ liệu.
6. Trong phân tích hồi quy bội (Multiple regression), điều gì khác biệt so với hồi quy tuyến tính đơn giản?
A. Chỉ có một biến độc lập.
B. Không có biến phụ thuộc.
C. Có nhiều hơn một biến độc lập.
D. Chỉ sử dụng biến định tính.
7. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Chiều cao trung bình của người trưởng thành.
B. Số lần một sự kiện hiếm xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Điểm kiểm tra của học sinh.
D. Thu nhập hàng năm của người dân.
8. Sai số chuẩn (Standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ biến động của trung bình mẫu giữa các mẫu khác nhau.
D. Trung bình của các sai số.
9. Phương pháp lấy mẫu nào đảm bảo mọi đơn vị trong quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu thuận tiện
10. Giá trị ngoại lệ (Outlier) là gì trong thống kê?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất.
C. Giá trị rất khác biệt so với phần lớn dữ liệu.
D. Giá trị ở vị trí giữa của dữ liệu.
11. Biến định tính (Categorical variable) còn được gọi là gì?
A. Biến liên tục
B. Biến rời rạc
C. Biến phân loại
D. Biến số
12. Phương pháp thống kê nào thích hợp nhất để kiểm tra sự khác biệt về trung bình giữa hai nhóm độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t độc lập (Independent t-test)
C. Kiểm định Chi-bình phương
D. Hồi quy tuyến tính
13. Khi tăng kích thước mẫu, điều gì thường xảy ra với sai số chuẩn của trung bình mẫu?
A. Tăng lên
B. Giảm xuống
C. Không đổi
D. Thay đổi không dự đoán được
14. Trong thống kê mô tả, 'mốt′ (Mode) là gì?
A. Giá trị trung bình cộng của dữ liệu.
B. Giá trị ở giữa của dữ liệu đã sắp xếp.
C. Giá trị xuất hiện nhiều nhất trong dữ liệu.
D. Hiệu giữa giá trị lớn nhất và nhỏ nhất.
15. Độ lệch chuẩn của mẫu (Sample standard deviation) được ký hiệu là gì?
16. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) cho biết điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Độ mạnh của mối quan hệ giữa các biến.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
D. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
17. Loại biểu đồ nào thích hợp nhất để thể hiện phân phối tần số của một biến định lượng liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ đường
18. Khoảng tin cậy (Confidence interval) cung cấp thông tin gì?
A. Giá trị điểm ước lượng chính xác của tham số.
B. Một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Xác suất tham số quần thể bằng một giá trị cụ thể.
D. Mức độ ý nghĩa thống kê của kết quả.
19. Phương pháp nào sau đây là một kỹ thuật lấy mẫu phi ngẫu nhiên?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
20. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn tính toán trung bình.
21. Phân phối nào thường được sử dụng để ước lượng khoảng tin cậy cho trung bình quần thể khi độ lệch chuẩn quần thể chưa biết và kích thước mẫu nhỏ?
A. Phân phối chuẩn Z
B. Phân phối t-Student
C. Phân phối Chi-bình phương
D. Phân phối F
22. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát dữ liệu cực đoan như dữ liệu đã cho nếu giả thuyết null là đúng.
C. Mức độ quan trọng thực tiễn của kết quả.
D. Kích thước của hiệu ứng.
23. Phân phối chuẩn (Normal distribution) có hình dạng như thế nào?
A. Lệch trái
B. Lệch phải
C. Hình chuông đối xứng
D. Hình chữ nhật
24. Hệ số tương quan (Correlation coefficient) đo lường điều gì?
A. Xu hướng trung tâm của dữ liệu.
B. Độ phân tán của dữ liệu.
C. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa các nhóm.
25. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường độ phân tán của dữ liệu.
26. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
27. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả và tóm tắt dữ liệu.
B. Thu thập dữ liệu từ quần thể.
C. Đưa ra kết luận về quần thể dựa trên dữ liệu mẫu.
D. Tính toán các đại lượng thống kê mô tả.
28. Đại lượng nào sau đây không bị ảnh hưởng bởi giá trị ngoại lệ?
A. Trung bình
B. Độ lệch chuẩn
C. Trung vị
D. Khoảng
29. Khi hệ số tương quan bằng 0, điều đó có nghĩa là gì?
A. Có mối quan hệ tuyến tính mạnh mẽ.
B. Có mối quan hệ tuyến tính yếu.
C. Không có mối quan hệ tuyến tính.
D. Có mối quan hệ phi tuyến tính.
30. Trong kiểm định giả thuyết, lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Không bác bỏ giả thuyết null khi nó sai.
C. Chấp nhận giả thuyết đối khi nó sai.
D. Bác bỏ giả thuyết đối khi nó đúng.