1. Biểu đồ tần suất (histogram) thường được sử dụng để biểu diễn loại dữ liệu nào?
A. Dữ liệu định tính.
B. Dữ liệu định lượng liên tục.
C. Dữ liệu thứ hạng.
D. Dữ liệu rời rạc.
2. Mục đích của việc lấy mẫu ngẫu nhiên là gì?
A. Để đảm bảo mẫu có kích thước lớn nhất có thể.
B. Để giảm chi phí và thời gian thu thập dữ liệu.
C. Để đảm bảo mọi thành viên của quần thể có cơ hội được chọn như nhau, giảm thiểu thiên vị.
D. Để chọn ra những thành viên 'điển hình′ nhất của quần thể.
3. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra tính độc lập giữa hai biến định tính hoặc kiểm định sự phù hợp của phân phối.
C. Dự đoán giá trị của biến phụ thuộc.
D. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
4. Bootstrap là phương pháp thống kê dùng để làm gì?
A. Tăng kích thước mẫu ban đầu.
B. Ước lượng phân phối lấy mẫu của một thống kê bằng cách lấy mẫu lại từ dữ liệu mẫu ban đầu.
C. Chuẩn hóa dữ liệu.
D. Phân tích phương sai.
5. Khi nào nên sử dụng kiểm định t thay vì kiểm định z?
A. Khi kích thước mẫu lớn hơn 30.
B. Khi độ lệch chuẩn quần thể đã biết.
C. Khi kích thước mẫu nhỏ và độ lệch chuẩn quần thể chưa biết.
D. Kiểm định t và z luôn có thể thay thế cho nhau.
6. Phương pháp lấy mẫu phân tầng (stratified sampling) được sử dụng khi nào?
A. Khi quần thể đồng nhất.
B. Khi muốn đảm bảo tính đại diện của các nhóm con (strata) trong quần thể.
C. Khi không có thông tin về quần thể.
D. Khi muốn lấy mẫu nhanh chóng và dễ dàng nhất.
7. Trong phân tích hồi quy tuyến tính, mục tiêu chính là gì?
A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị của biến phụ thuộc dựa trên biến độc lập.
C. Tính toán độ lệch chuẩn của mẫu.
D. Xác định trung vị của dữ liệu.
8. Sai số loại I trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng.
B. Không bác bỏ giả thuyết không đúng.
C. Bác bỏ giả thuyết không đúng khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không đúng khi nó thực sự sai.
9. Trung vị của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất.
C. Giá trị ở giữa khi dữ liệu được sắp xếp theo thứ tự.
D. Tổng tất cả các giá trị chia cho số lượng giá trị.
10. Độ tin cậy (power) của một kiểm định thống kê là gì?
A. Xác suất mắc sai số loại I.
B. Xác suất mắc sai số loại II.
C. Xác suất bác bỏ đúng giả thuyết không đúng.
D. Xác suất không bác bỏ giả thuyết không đúng.
11. Giá trị IQR (Interquartile Range - Khoảng tứ phân vị) đo lường điều gì?
A. Toàn bộ phạm vi của dữ liệu.
B. Phạm vi của 50% dữ liệu ở giữa.
C. Độ lệch chuẩn của dữ liệu.
D. Phương sai của dữ liệu.
12. Hệ số biến thiên (coefficient of variation) là gì?
A. Độ lệch chuẩn của mẫu.
B. Phương sai của mẫu.
C. Tỷ lệ giữa độ lệch chuẩn và giá trị trung bình, thường biểu diễn dưới dạng phần trăm.
D. Khoảng tứ phân vị.
13. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất.
C. Giá trị cực kỳ khác biệt so với phần lớn dữ liệu còn lại.
D. Giá trị ở giữa của tập dữ liệu đã sắp xếp.
14. Kiểm định phi tham số (non-parametric test) được sử dụng khi nào?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu rất lớn.
C. Khi các giả định về phân phối dữ liệu không được đáp ứng, đặc biệt với mẫu nhỏ hoặc dữ liệu thứ hạng.
D. Kiểm định phi tham số luôn ưu việt hơn kiểm định tham số.
15. Trong phân tích chuỗi thời gian, thành phần 'xu hướng′ (trend) đề cập đến điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Mô hình dài hạn, tăng hoặc giảm, trong dữ liệu theo thời gian.
C. Các biến động lặp lại trong khoảng thời gian cố định (ví dụ theo mùa).
D. Sự thay đổi đột ngột và bất thường trong dữ liệu.
16. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của biến phụ thuộc.
17. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Chiều cao của người.
B. Số lượng sự kiện hiếm gặp xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Điểm số trong bài kiểm tra.
D. Thu nhập của người dân.
18. Biến định tính khác với biến định lượng ở điểm nào?
A. Biến định tính có thể được đo bằng số, biến định lượng thì không.
B. Biến định tính biểu thị các thuộc tính hoặc danh mục, biến định lượng biểu thị số lượng hoặc số đo.
C. Biến định tính luôn rời rạc, biến định lượng luôn liên tục.
D. Không có sự khác biệt đáng kể giữa hai loại biến này.
19. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng khoảng này chứa giá trị trung bình mẫu.
B. Có 95% khả năng khoảng này chứa giá trị trung bình quần thể thực sự.
C. Khoảng này bao phủ 95% dữ liệu.
D. Sai số chuẩn của trung bình mẫu là 95%.
20. Giá trị trung bình của mẫu được tính bằng cách nào?
A. Nhân tất cả các giá trị trong mẫu.
B. Chia tổng các giá trị trong mẫu cho số lượng giá trị.
C. Giá trị xuất hiện nhiều nhất trong mẫu.
D. Giá trị ở giữa mẫu sau khi sắp xếp.
21. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
22. Trong kiểm định giả thuyết, 'giá trị p′ đại diện cho điều gì?
A. Xác suất giả thuyết đối thuyết là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả mẫu nếu giả thuyết không đúng là đúng.
C. Ngưỡng ý nghĩa thống kê được chọn trước.
D. Kích thước của mẫu nghiên cứu.
23. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Để loại bỏ giá trị ngoại lệ.
B. Để chuyển đổi dữ liệu về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn.
C. Để làm cho dữ liệu tuân theo phân phối chuẩn.
D. Để tăng kích thước mẫu.
24. Độ lệch chuẩn đo lường điều gì?
A. Trung bình của tập dữ liệu.
B. Phương sai của tập dữ liệu.
C. Độ phân tán của dữ liệu xung quanh giá trị trung bình, tính bằng đơn vị gốc.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong dữ liệu.
25. Phương sai đo lường điều gì về một tập dữ liệu?
A. Mức độ tập trung của dữ liệu quanh trung tâm.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
26. Hệ số tương quan Pearson đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
B. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
C. Sự thay đổi trung bình của một biến khi biến kia tăng lên một đơn vị.
D. Tỷ lệ phần trăm phương sai của một biến được giải thích bởi biến kia.
27. Sai số chuẩn của trung bình mẫu (standard error of the mean) cho biết điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối các trung bình mẫu.
D. Phương sai của mẫu.
28. Phân phối nhị thức (binomial distribution) mô tả điều gì?
A. Thời gian giữa các sự kiện.
B. Xác suất thành công trong một chuỗi thử nghiệm độc lập có hai kết quả có thể.
C. Phân phối của dữ liệu liên tục.
D. Số lượng sự kiện trong một khoảng thời gian.
29. Phân phối chuẩn có đặc điểm quan trọng nào?
A. Luôn luôn lệch phải.
B. Đối xứng và có hình chuông.
C. Có hai đỉnh.
D. Luôn luôn đồng đều.
30. Mức ý nghĩa (alpha, α) trong kiểm định giả thuyết thường được đặt ở mức nào?
A. 10%
B. 20%
C. 5%
D. 50%