1. Nếu hệ số tương quan (r) giữa hai biến là -0.8, điều này cho thấy mối quan hệ gì?
A. Mối quan hệ tuyến tính mạnh và dương.
B. Mối quan hệ tuyến tính yếu và dương.
C. Mối quan hệ tuyến tính mạnh và âm.
D. Không có mối quan hệ tuyến tính.
2. Kiểm định giả thuyết một phía (one-tailed test) được sử dụng khi nào?
A. Khi không có hướng cụ thể cho giả thuyết thay thế.
B. Khi quan tâm đến sự khác biệt theo cả hai hướng.
C. Khi giả thuyết thay thế chỉ định hướng cụ thể của sự khác biệt (lớn hơn hoặc nhỏ hơn).
D. Khi kích thước mẫu lớn.
3. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả và tóm tắt dữ liệu.
B. Thu thập dữ liệu từ mẫu.
C. Rút ra kết luận về quần thể dựa trên dữ liệu mẫu.
D. Tính toán các thống kê mô tả.
4. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn (Normal distribution)
B. Phân phối nhị thức (Binomial distribution)
C. Phân phối Poisson (Poisson distribution)
D. Phân phối đều (Uniform distribution)
5. Khi nào thì sử dụng kiểm định Chi-bình phương (Chi-squared test) cho tính độc lập?
A. So sánh trung bình của hai nhóm độc lập.
B. Phân tích mối quan hệ giữa hai biến định tính.
C. Ước lượng trung bình quần thể.
D. Kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn.
6. Trong kiểm định giả thuyết, lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
D. Không bác bỏ giả thuyết thay thế khi nó thực sự sai.
7. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nhóm.
8. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của yếu tố nhiễu trong nghiên cứu quan sát?
A. Thử nghiệm ngẫu nhiên có đối chứng (Randomized controlled trial).
B. Nghiên cứu cắt ngang (Cross-sectional study).
C. Phân tích hồi quy đa biến (Multiple regression).
D. Thống kê mô tả (Descriptive statistics).
9. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc lỗi loại II là 5%.
B. Xác suất giả thuyết null là đúng là 5%.
C. Ngưỡng xác suất tối đa để bác bỏ giả thuyết null khi nó đúng (lỗi loại I) là 5%.
D. Độ tin cậy của kết quả kiểm định là 95%.
10. Phương pháp nào sau đây phù hợp nhất để phân tích mối quan hệ giữa một biến phụ thuộc định lượng và một hoặc nhiều biến độc lập định tính?
A. Hồi quy tuyến tính đơn (Simple linear regression)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương (Chi-squared test)
D. Hồi quy logistic (Logistic regression)
11. Phương pháp thống kê nào sau đây phù hợp để dự báo giá trị tương lai dựa trên dữ liệu chuỗi thời gian?
A. Phân tích hồi quy đa biến (Multiple regression)
B. Phân tích chuỗi thời gian (Time series analysis)
C. Kiểm định t (t-test)
D. Phân tích phương sai (ANOVA)
12. Phân phối nào sau đây có dạng hình chuông đối xứng và được xác định bởi trung bình và độ lệch chuẩn?
A. Phân phối Poisson (Poisson distribution)
B. Phân phối nhị thức (Binomial distribution)
C. Phân phối chuẩn (Normal distribution)
D. Phân phối đều (Uniform distribution)
13. Trong phân tích dữ liệu, 'chuẩn hóa dữ liệu′ (data normalization) thường được thực hiện để làm gì?
A. Tăng kích thước mẫu.
B. Giảm số lượng biến.
C. Đưa dữ liệu về cùng thang đo để so sánh và phân tích.
D. Loại bỏ giá trị ngoại lệ.
14. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị trung bình của biến độc lập khi biến phụ thuộc bằng 0.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0.
D. Mức độ phù hợp của mô hình hồi quy.
15. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Trung bình (Mean)
C. Độ lệch chuẩn (Standard Deviation)
D. Mốt (Mode)
16. Giá trị ngoại lệ (Outlier) trong dữ liệu là gì?
A. Giá trị xuất hiện thường xuyên nhất trong dữ liệu.
B. Giá trị nằm gần trung bình của dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị trung vị của dữ liệu.
17. Khoảng tin cậy (Confidence interval) cho trung bình quần thể được sử dụng để ước lượng điều gì?
A. Trung bình mẫu.
B. Trung bình quần thể thực sự.
C. Phương sai quần thể.
D. Độ lệch chuẩn mẫu.
18. Độ lệch chuẩn của phân phối lấy mẫu trung bình (standard error of the mean) giảm khi nào?
A. Kích thước mẫu giảm.
B. Phương sai quần thể tăng.
C. Kích thước mẫu tăng.
D. Trung bình quần thể giảm.
19. Sai số chuẩn (Standard error) đo lường điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của quần thể.
C. Độ lệch chuẩn của phân phối lấy mẫu của một thống kê.
D. Phương sai của mẫu.
20. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu phân tầng (Stratified sampling)
B. Lấy mẫu cụm (Cluster sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu thuận tiện (Convenience sampling)
21. Độ tin cậy (Confidence level) của một khoảng tin cậy ảnh hưởng đến độ rộng của khoảng tin cậy như thế nào?
A. Độ tin cậy cao hơn làm khoảng tin cậy hẹp hơn.
B. Độ tin cậy thấp hơn làm khoảng tin cậy rộng hơn.
C. Độ tin cậy cao hơn làm khoảng tin cậy rộng hơn.
D. Độ tin cậy không ảnh hưởng đến độ rộng khoảng tin cậy.
22. Biến định tính (Categorical variable) khác với biến định lượng (Quantitative variable) ở điểm nào?
A. Biến định tính có giá trị là số, biến định lượng là chữ.
B. Biến định tính biểu thị thuộc tính hoặc nhóm, biến định lượng biểu thị số lượng hoặc đo lường.
C. Biến định tính luôn rời rạc, biến định lượng luôn liên tục.
D. Biến định tính có thể thực hiện các phép toán số học, biến định lượng thì không.
23. Hồi quy logistic (Logistic regression) được sử dụng khi biến phụ thuộc thuộc loại nào?
A. Định lượng liên tục.
B. Định lượng rời rạc.
C. Định tính nhị phân (binary).
D. Định tính đa danh mục (multinomial).
24. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất giả thuyết thay thế là đúng.
C. Xác suất quan sát được kết quả cực đoan như kết quả mẫu, giả sử giả thuyết null là đúng.
D. Ngưỡng ý nghĩa thống kê được chọn trước.
25. Giá trị 'mode′ (mốt) của một tập dữ liệu là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị ở giữa dữ liệu đã sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất trong dữ liệu.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
26. Phân phối nhị thức (Binomial distribution) mô tả xác suất thành công trong bao nhiêu phép thử độc lập?
A. Một phép thử.
B. Số lượng phép thử cố định (n).
C. Vô số phép thử.
D. Phép thử cho đến khi thành công đầu tiên.
27. Loại biểu đồ nào thích hợp nhất để so sánh phân phối của một biến số định lượng giữa hai nhóm?
A. Biểu đồ tròn (Pie chart)
B. Biểu đồ thanh (Bar chart)
C. Biểu đồ hộp (Box plot)
D. Biểu đồ đường (Line chart)
28. Trong thống kê mô tả, 'tứ phân vị' (quartiles) chia dữ liệu đã sắp xếp thành bao nhiêu phần bằng nhau?
29. Khi nào thì nên sử dụng trung vị (median) thay vì trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu không có giá trị ngoại lệ.
C. Khi dữ liệu bị lệch hoặc có giá trị ngoại lệ.
D. Khi muốn tính tổng các giá trị.
30. Hệ số tương quan Pearson đo lường điều gì giữa hai biến số định lượng?
A. Mức độ phụ thuộc phi tuyến tính.
B. Mức độ biến thiên của một biến.
C. Mức độ quan hệ tuyến tính và hướng của mối quan hệ.
D. Sự khác biệt về trung bình giữa hai biến.