1. Giá trị ngoại lệ (Outlier) trong một tập dữ liệu là gì?
A. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
B. Giá trị nằm gần trung tâm của tập dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
2. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Giá trị trung bình (Mean)
C. Độ lệch chuẩn (Standard Deviation)
D. Mốt (Mode)
3. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để kiểm tra điều gì?
A. Sự khác biệt giữa giá trị trung bình của hai nhóm.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự độc lập giữa hai biến định tính (categorical variables).
D. Sự phân tán của dữ liệu xung quanh giá trị trung bình.
4. Trong ngữ cảnh của độ giá trị (Validity) trong nghiên cứu, 'validity nội tại' (internal validity) đề cập đến điều gì?
A. Khả năng tổng quát hóa kết quả nghiên cứu cho các quần thể khác.
B. Mức độ chắc chắn rằng mối quan hệ nhân quả quan sát được trong nghiên cứu là thực sự và không bị ảnh hưởng bởi các yếu tố gây nhiễu.
C. Tính nhất quán của kết quả đo lường qua các lần đo khác nhau.
D. Mức độ phương pháp đo lường đo lường chính xác khái niệm mong muốn.
5. Trong phân tích hồi quy tuyến tính, hệ số chặn (Intercept) đại diện cho điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
6. Phương pháp thống kê nào thường được sử dụng để so sánh giá trị trung bình của hai nhóm độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test) cho hai mẫu độc lập
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương (Chi-squared test)
7. Hệ số tương quan (Correlation coefficient) đo lường điều gì giữa hai biến số định lượng?
A. Mức độ biến động của một biến.
B. Sức mạnh và hướng của mối quan hệ tuyến tính.
C. Sự khác biệt giữa giá trị trung bình của hai biến.
D. Khả năng biến này gây ra biến kia.
8. Loại biểu đồ nào phù hợp nhất để hiển thị tần suất phân bố của một biến số liên tục?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ đường (Line chart)
9. Khoảng tin cậy (Confidence interval) cung cấp thông tin gì về tham số của quần thể?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị mà tham số quần thể có khả năng cao nằm trong đó.
C. Mức độ ý nghĩa thống kê của tham số.
D. Độ lệch chuẩn của tham số quần thể.
10. Phương pháp lấy mẫu phân tầng (Stratified sampling) được sử dụng khi nào?
A. Khi tổng thể đồng nhất.
B. Khi muốn đảm bảo mẫu đại diện cho các nhóm con (strata) khác nhau trong tổng thể.
C. Khi không có khung mẫu.
D. Khi muốn lấy mẫu nhanh chóng và dễ dàng nhất.
11. Ưu điểm chính của việc sử dụng kích thước mẫu lớn hơn trong nghiên cứu thống kê là gì?
A. Giảm chi phí và thời gian thu thập dữ liệu.
B. Tăng tính đại diện của mẫu cho quần thể và giảm sai số lấy mẫu.
C. Đơn giản hóa quá trình phân tích dữ liệu.
D. Đảm bảo rằng dữ liệu tuân theo phân phối chuẩn.
12. Khi thực hiện kiểm định giả thuyết một đuôi (one-tailed test), chúng ta quan tâm đến điều gì?
A. Sự khác biệt theo cả hai hướng so với giả thuyết null.
B. Sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn) so với giả thuyết null.
C. Sự khác biệt lớn nhất có thể so với giả thuyết null.
D. Sự khác biệt ngẫu nhiên so với giả thuyết null.
13. Giá trị P (P-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả đã thấy (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
C. Mức ý nghĩa thống kê của kiểm định.
D. Kích thước của hiệu ứng nghiên cứu.
14. Độ tin cậy (Reliability) của một phương pháp đo lường đề cập đến điều gì?
A. Mức độ phương pháp đo lường đo lường chính xác khái niệm mong muốn.
B. Tính nhất quán và ổn định của kết quả đo lường qua các lần đo khác nhau.
C. Khả năng áp dụng kết quả nghiên cứu cho các quần thể khác.
D. Mức độ chi phí hiệu quả của phương pháp đo lường.
15. Trong phân tích dữ liệu, 'data cleaning' (làm sạch dữ liệu) bao gồm những công việc chính nào?
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Xác định và sửa chữa các lỗi, giá trị thiếu, và dữ liệu không nhất quán trong tập dữ liệu.
C. Phân tích dữ liệu bằng các phương pháp thống kê.
D. Trình bày dữ liệu bằng biểu đồ và bảng biểu.
16. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?
A. Sự kiện có hai kết quả có thể (thành công/thất bại).
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Thời gian cho đến khi một sự kiện xảy ra.
D. Đo lường chiều cao và cân nặng của con người.
17. Trong thống kê Bayes, 'prior probability' (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu quan sát được.
B. Xác suất ban đầu về một giả thuyết trước khi xem xét dữ liệu.
C. Xác suất của một giả thuyết sau khi xem xét dữ liệu.
D. Xác suất của giả thuyết null.
18. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của các yếu tố gây nhiễu trong nghiên cứu quan sát?
A. Thử nghiệm ngẫu nhiên có đối chứng (Randomized controlled trial)
B. Phân tích hồi quy đa biến (Multiple regression analysis)
C. Thống kê mô tả (Descriptive statistics)
D. Kiểm định t (t-test)
19. Khái niệm 'bậc tự do' (degrees of freedom) trong thống kê liên quan đến điều gì?
A. Tổng số quan sát trong mẫu.
B. Số lượng giá trị trong tập dữ liệu có thể tự do biến đổi khi tính toán một thống kê nhất định.
C. Mức ý nghĩa thống kê được chọn.
D. Độ lệch chuẩn của mẫu.
20. Khi nào thì việc sử dụng thống kê phi tham số (Non-parametric statistics) là phù hợp hơn thống kê tham số (Parametric statistics)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của thống kê tham số không được đáp ứng, ví dụ dữ liệu không phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi cần tính toán trung bình và độ lệch chuẩn.
21. Trong kiểm định giả thuyết thống kê, lỗi Loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chấp nhận giả thuyết đối khi nó thực sự sai.
D. Bác bỏ giả thuyết đối khi nó thực sự đúng.
22. Thống kê suy luận (Inferential statistics) chủ yếu được sử dụng để làm gì?
A. Mô tả các đặc điểm của mẫu dữ liệu.
B. Rút ra kết luận hoặc đưa ra dự đoán về quần thể dựa trên dữ liệu mẫu.
C. Trình bày dữ liệu một cách trực quan bằng biểu đồ.
D. Tính toán các giá trị trung bình và độ lệch chuẩn.
23. Phương pháp thống kê nào được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc định tính và một hoặc nhiều biến độc lập (có thể định tính hoặc định lượng)?
A. Phân tích phương sai (ANOVA)
B. Hồi quy tuyến tính đa biến
C. Hồi quy logistic (Logistic regression)
D. Kiểm định tương quan Pearson
24. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ ý nghĩa thống kê của mô hình hồi quy.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
25. Sai số chuẩn của trung bình mẫu (Standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Trung bình của phân phối lấy mẫu của trung bình mẫu.
26. Khi nào thì sử dụng kiểm định tương quan Spearman thay vì Pearson?
A. Khi muốn đo lường mối quan hệ tuyến tính giữa hai biến.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thứ bậc (ordinal data).
D. Khi muốn so sánh giá trị trung bình của hai nhóm.
27. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Có sự khác biệt đáng kể giữa giá trị trung bình của các nhóm.
B. Không có sự khác biệt đáng kể giữa giá trị trung bình của các nhóm.
C. Phương sai của các nhóm là khác nhau.
D. Phương sai của các nhóm là bằng nhau.
28. Phân loại dữ liệu nào sau đây mô tả dữ liệu có thể được sắp xếp theo thứ tự, nhưng khoảng cách giữa các giá trị không có ý nghĩa?
A. Định danh (Nominal)
B. Thứ bậc (Ordinal)
C. Khoảng (Interval)
D. Tỷ lệ (Ratio)
29. Phương pháp lấy mẫu nào đảm bảo rằng mọi đơn vị trong tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu cụm (Cluster sampling)
30. Phân phối chuẩn (Normal distribution) còn được gọi là phân phối nào?
A. Phân phối Poisson
B. Phân phối nhị thức
C. Phân phối Gaussian
D. Phân phối mũ