1. Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì về phân phối dữ liệu?
A. Mối quan hệ giữa hai biến số.
B. Tần số xuất hiện của các giá trị.
C. Độ lệch chuẩn và giá trị trung bình.
D. Phân vị, giá trị trung vị, và sự phân tán của dữ liệu.
2. Trong thống kê ứng dụng, khái niệm 'phân phối lấy mẫu′ (sampling distribution) đề cập đến điều gì?
A. Phân phối của dữ liệu trong mẫu.
B. Phân phối lý thuyết của một thống kê mẫu (ví dụ, trung bình mẫu) nếu chúng ta lấy nhiều mẫu từ cùng một quần thể.
C. Phân phối của quần thể mà từ đó mẫu được lấy.
D. Phân phối của sai số chuẩn.
3. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối dữ liệu không được đáp ứng.
D. Khi cần độ chính xác cao hơn.
4. Sai số chuẩn của trung bình mẫu (standard error of the mean) giảm khi điều gì xảy ra?
A. Độ lệch chuẩn của quần thể tăng.
B. Kích thước mẫu giảm.
C. Kích thước mẫu tăng.
D. Giá trị trung bình của quần thể tăng.
5. Trong phân tích hồi quy tuyến tính, hệ số R bình phương (R²) thể hiện điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của mô hình hồi quy.
D. Giá trị p của các hệ số hồi quy.
6. Ứng dụng chính của phân tích cụm (cluster analysis) trong thống kê ứng dụng là gì?
A. Dự đoán giá trị tương lai.
B. Phân nhóm dữ liệu thành các nhóm có ý nghĩa dựa trên sự tương đồng.
C. Kiểm tra sự khác biệt giữa các nhóm đã biết trước.
D. Đo lường mối quan hệ tuyến tính.
7. Phương pháp lấy mẫu nào đảm bảo mọi cá thể trong quần thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo mục đích.
8. Trong thống kê ứng dụng, thuật ngữ 'thống kê kiểm định′ (test statistic) dùng để chỉ điều gì?
A. Giá trị trung bình của mẫu.
B. Một giá trị được tính từ dữ liệu mẫu để đưa ra quyết định về giả thuyết null.
C. Mức ý nghĩa thống kê.
D. Kích thước mẫu cần thiết.
9. Phân tích phương sai (ANOVA) chủ yếu được sử dụng để so sánh trung bình của bao nhiêu nhóm?
A. Chỉ hai nhóm.
B. Hai hoặc nhiều nhóm.
C. Luôn luôn ba nhóm.
D. Không giới hạn số lượng nhóm.
10. Phương pháp thống kê nào thường được sử dụng để kiểm tra sự khác biệt về trung bình giữa hai nhóm độc lập?
A. Phân tích hồi quy.
B. Kiểm định T-test độc lập.
C. Phân tích phương sai (ANOVA).
D. Tương quan Pearson.
11. Trong thống kê ứng dụng, thuật ngữ 'độ lệch chuẩn′ thường được dùng để đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất trong dữ liệu.
D. Số lần xuất hiện của giá trị phổ biến nhất.
12. Trong kiểm định giả thuyết, giá trị p (p-value) cho biết điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả cực đoan như kết quả đã thu được nếu giả thuyết null là đúng.
C. Mức độ quan trọng thực tế của kết quả.
D. Kích thước hiệu ứng của hiện tượng đang nghiên cứu.
13. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật lấy mẫu xác suất?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
14. Phương pháp thống kê nào thường được sử dụng để giảm số chiều dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA).
D. Kiểm định T-test.
15. Loại lỗi nào xảy ra khi chúng ta bác bỏ giả thuyết null trong khi nó thực sự đúng?
A. Lỗi loại II.
B. Lỗi loại I.
C. Sai số hệ thống.
D. Sai số ngẫu nhiên.
16. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. So sánh trung bình của hai nhóm độc lập.
B. So sánh trung bình của hai nhóm phụ thuộc (dữ liệu cặp đôi) khi không đáp ứng giả định phân phối chuẩn.
C. Kiểm tra sự độc lập giữa hai biến phân loại.
D. Phân tích phương sai cho nhiều nhóm.
17. Khi nào thì sử dụng kiểm định Chi-bình phương?
A. So sánh trung bình của hai nhóm.
B. Đo lường tương quan giữa hai biến liên tục.
C. Kiểm tra sự độc lập giữa hai biến phân loại.
D. Dự đoán giá trị của biến phụ thuộc.
18. Loại biểu đồ nào thích hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường.
B. Biểu đồ tán xạ.
C. Biểu đồ tần suất (histogram) hoặc biểu đồ hộp song song.
D. Biểu đồ tròn.
19. Trong thống kê ứng dụng, 'kích thước hiệu ứng′ (effect size) quan trọng vì điều gì?
A. Xác định mức ý nghĩa thống kê.
B. Đo lường độ mạnh hoặc độ lớn thực tế của một hiệu ứng hoặc mối quan hệ.
C. Giảm sai số loại I.
D. Tăng kích thước mẫu cần thiết.
20. Trong thống kê ứng dụng, 'dữ liệu bảng′ (panel data) có đặc điểm gì?
A. Dữ liệu thu thập từ một thời điểm duy nhất.
B. Dữ liệu kết hợp cả chiều không gian (các đơn vị quan sát) và chiều thời gian.
C. Dữ liệu chỉ chứa biến định tính.
D. Dữ liệu chỉ được thu thập từ các thí nghiệm.
21. Trong thống kê, 'khoảng tin cậy′ được sử dụng để ước tính điều gì?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị có khả năng chứa tham số quần thể thực sự.
C. Sai số chuẩn của trung bình mẫu.
D. Mức ý nghĩa thống kê của kiểm định giả thuyết.
22. Trong thống kê ứng dụng, 'phân tích sống sót′ (survival analysis) được sử dụng chủ yếu trong lĩnh vực nào?
A. Marketing.
B. Y tế và sinh học.
C. Kinh tế học.
D. Kỹ thuật.
23. Trong thống kê ứng dụng, 'ngoại lệ' (outlier) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất.
C. Giá trị nằm rất xa so với phần lớn các giá trị khác trong tập dữ liệu.
D. Giá trị trung vị của dữ liệu.
24. Thống kê mô tả khác biệt với thống kê suy diễn chủ yếu ở điểm nào?
A. Thống kê mô tả sử dụng dữ liệu mẫu, còn suy diễn dùng dữ liệu quần thể.
B. Thống kê mô tả tóm tắt dữ liệu, còn suy diễn đưa ra kết luận về quần thể.
C. Thống kê mô tả phức tạp hơn thống kê suy diễn.
D. Thống kê mô tả chỉ dùng cho dữ liệu định tính.
25. Trong phân tích dữ liệu định tính, phương pháp 'mã hóa′ (coding) được dùng để làm gì?
A. Tính toán giá trị trung bình.
B. Tìm kiếm mối quan hệ nhân quả.
C. Phân loại và gán nhãn cho các đoạn dữ liệu để tìm ra chủ đề và mẫu.
D. Chuẩn hóa dữ liệu về thang đo chung.
26. Tương quan Pearson đo lường loại mối quan hệ nào giữa hai biến số?
A. Mối quan hệ nhân quả.
B. Mối quan hệ phi tuyến tính.
C. Mối quan hệ tuyến tính.
D. Mối quan hệ hàm mũ.
27. Trong thống kê ứng dụng, 'hồi quy logistic′ (logistic regression) được sử dụng khi nào?
A. Khi biến phụ thuộc là biến liên tục.
B. Khi muốn dự đoán giá trị trung bình.
C. Khi biến phụ thuộc là biến phân loại nhị phân (có hai giá trị).
D. Khi không có biến độc lập.
28. Trong phân tích hồi quy, 'sai số chuẩn của hệ số hồi quy′ (standard error of regression coefficient) đo lường điều gì?
A. Độ mạnh của mối quan hệ.
B. Độ lệch chuẩn của biến phụ thuộc.
C. Độ không chắc chắn trong ước tính hệ số hồi quy.
D. Phần trăm phương sai được giải thích.
29. Trong thống kê ứng dụng, 'đa cộng tuyến′ (multicollinearity) là vấn đề thường gặp trong loại phân tích nào?
A. Phân tích T-test.
B. Phân tích phương sai (ANOVA).
C. Phân tích hồi quy đa biến.
D. Phân tích tần số.
30. Ưu điểm chính của việc sử dụng thống kê phi tham số là gì so với thống kê tham số?
A. Đòi hỏi kích thước mẫu lớn hơn.
B. Ít nhạy cảm hơn với ngoại lệ và không yêu cầu giả định phân phối nghiêm ngặt.
C. Luôn cho kết quả chính xác hơn.
D. Dễ tính toán hơn.