1. Trong kiểm định giả thuyết, 'mức ý nghĩa′ (significance level) α thường được đặt ở mức bao nhiêu?
A. 0.5
B. 0.1
C. 0.05
D. 1.0
2. Phương pháp thống kê nào phù hợp nhất để kiểm tra xem có mối liên hệ giữa hai biến định tính hay không?
A. Phân tích hồi quy tuyến tính
B. Kiểm định t (t-test)
C. Kiểm định Chi-bình phương (Chi-square test)
D. Phân tích phương sai (ANOVA)
3. Ứng dụng nào sau đây thể hiện việc sử dụng thống kê mô tả?
A. Dự đoán doanh số bán hàng trong tương lai dựa trên dữ liệu quá khứ
B. Ước tính tỷ lệ ủng hộ một ứng cử viên chính trị dựa trên một mẫu
C. Tính toán điểm trung bình môn học (GPA) của sinh viên trong một lớp
D. Kiểm tra xem một loại thuốc mới có hiệu quả hơn thuốc hiện tại hay không
4. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của một biến
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa trung bình của hai biến
D. Mức độ phù hợp của mô hình hồi quy
5. Loại sai lệch nào xảy ra khi mẫu không đại diện cho quần thể mục tiêu?
A. Sai lệch chọn mẫu (Selection bias)
B. Sai lệch đo lường (Measurement bias)
C. Sai lệch thông tin (Information bias)
D. Sai lệch nhớ lại (Recall bias)
6. Khoảng tin cậy (confidence interval) được sử dụng để ước lượng điều gì?
A. Kích thước mẫu cần thiết cho một nghiên cứu
B. Tham số quần thể (population parameter)
C. Thống kê mẫu (sample statistic)
D. Giá trị p trong kiểm định giả thuyết
7. Trong phân tích dữ liệu khảo sát, tỷ lệ phản hồi thấp có thể dẫn đến vấn đề gì?
A. Tăng độ chính xác của ước lượng
B. Giảm sai số lấy mẫu
C. Sai lệch do không phản hồi (Non-response bias)
D. Tăng tính đại diện của mẫu
8. Khi nào thì giá trị trung bình hình học (geometric mean) thích hợp hơn giá trị trung bình cộng (arithmetic mean)?
A. Khi dữ liệu có phân phối chuẩn
B. Khi tính trung bình của tỷ lệ hoặc phần trăm thay đổi
C. Khi dữ liệu có giá trị âm
D. Khi dữ liệu không có giá trị ngoại lệ
9. Trong phân tích phương sai (ANOVA), mục đích chính của việc so sánh phương sai giữa các nhóm và phương sai trong nhóm là gì?
A. Để xác định sự khác biệt về phương sai tổng thể
B. Để kiểm tra xem có sự khác biệt đáng kể về trung bình giữa các nhóm hay không
C. Để đo lường mức độ tương quan giữa các biến
D. Để xác định phương sai lớn nhất trong dữ liệu
10. Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Không bác bỏ giả thuyết null khi nó thực sự sai
C. Chọn một kích thước mẫu quá nhỏ
D. Sử dụng kiểm định thống kê không phù hợp
11. Phương pháp thống kê nào thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction)?
A. Phân tích hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Kiểm định t (t-test)
12. Loại dữ liệu nào sau đây là dữ liệu định tính?
A. Chiều cao của sinh viên
B. Nhiệt độ phòng
C. Màu sắc yêu thích
D. Số lượng sách trong thư viện
13. Trong thống kê ứng dụng, loại trung bình nào bị ảnh hưởng nhiều nhất bởi giá trị ngoại lệ (outlier)?
A. Trung vị (Median)
B. Trung bình cộng (Mean)
C. Mode (Mốt)
D. Trung bình nhân (Geometric Mean)
14. Khi nào thì trung vị (median) là thước đo trung tâm tốt hơn trung bình cộng (mean)?
A. Khi dữ liệu phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ
C. Khi dữ liệu đối xứng
D. Khi dữ liệu có phương sai nhỏ
15. Trong thống kê, 'độ lệch chuẩn′ (standard deviation) đo lường điều gì?
A. Trung tâm của dữ liệu
B. Sự phân tán hoặc độ biến động của dữ liệu xung quanh trung bình
C. Hình dạng phân phối của dữ liệu
D. Mức độ tin cậy của ước lượng
16. Phương pháp lấy mẫu nào đảm bảo mỗi thành viên của quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu theo cụm (Cluster sampling)
17. Trong phân tích dữ liệu thời gian, thành phần 'xu hướng′ (trend) mô tả điều gì?
A. Biến động ngắn hạn và ngẫu nhiên
B. Mô hình biến động theo mùa lặp lại
C. Sự thay đổi dài hạn và nhất quán theo thời gian
D. Sự kiện bất thường hoặc giá trị ngoại lệ
18. Biểu đồ hộp (boxplot) thường được sử dụng để thể hiện điều gì về một tập dữ liệu?
A. Tần suất xuất hiện của các giá trị
B. Xu hướng theo thời gian
C. Phân vị (quartiles), giá trị ngoại lệ và sự phân tán của dữ liệu
D. Mối quan hệ giữa hai biến
19. Phương pháp nào sau đây giúp kiểm soát sai số loại II (Type II error) trong kiểm định giả thuyết?
A. Giảm mức ý nghĩa α
B. Tăng kích thước mẫu
C. Sử dụng kiểm định một phía thay vì hai phía
D. Bác bỏ giả thuyết null một cách thận trọng hơn
20. Trong nghiên cứu khoa học, 'ý nghĩa thống kê' (statistical significance) có nghĩa là gì?
A. Kết quả nghiên cứu có tầm quan trọng thực tế lớn
B. Kết quả nghiên cứu có khả năng xảy ra do ngẫu nhiên rất thấp
C. Kết quả nghiên cứu chắc chắn đúng
D. Kết quả nghiên cứu được chấp nhận rộng rãi trong cộng đồng khoa học
21. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến tính giữa các biến
B. Sự tương quan cao giữa các biến độc lập
C. Phương sai của sai số quá lớn
D. Thiếu biến quan trọng trong mô hình
22. Ứng dụng của thống kê trong lĩnh vực y tế bao gồm:
A. Dự báo thời tiết
B. Phân tích hiệu quả của thuốc mới và phương pháp điều trị
C. Quản lý rủi ro tài chính
D. Thiết kế cầu đường
23. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không phân phối chuẩn)
D. Khi cần ước lượng tham số quần thể
24. Loại biểu đồ nào thích hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường (line chart)
B. Biểu đồ phân tán (scatter plot)
C. Biểu đồ tần suất (histogram) hoặc biểu đồ hộp song song (parallel boxplots)
D. Biểu đồ tròn (pie chart)
25. Phân tích hồi quy tuyến tính đơn giản được sử dụng chủ yếu để làm gì?
A. Mô tả hình dạng phân phối của một biến duy nhất
B. Xác định sự khác biệt giữa trung bình của hai nhóm độc lập
C. Dự đoán giá trị của một biến phụ thuộc dựa trên biến độc lập
D. Đo lường độ mạnh của mối quan hệ giữa hai biến định tính
26. Khi kích thước mẫu tăng lên, điều gì thường xảy ra với sai số chuẩn (standard error) của trung bình mẫu?
A. Sai số chuẩn tăng lên
B. Sai số chuẩn giảm xuống
C. Sai số chuẩn không đổi
D. Sai số chuẩn trở nên không xác định
27. Trong thống kê ứng dụng, khái niệm 'power′ của một kiểm định thống kê đề cập đến điều gì?
A. Xác suất mắc sai lầm loại I
B. Xác suất mắc sai lầm loại II
C. Xác suất bác bỏ đúng giả thuyết null khi nó thực sự sai
D. Xác suất không bác bỏ giả thuyết null khi nó thực sự đúng
28. Phương pháp 'bootstrap′ trong thống kê ứng dụng được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa trung bình của hai quần thể
B. Ước lượng độ chính xác của thống kê mẫu bằng cách lấy mẫu lại từ dữ liệu mẫu ban đầu
C. Xây dựng mô hình hồi quy tuyến tính
D. Phân tích dữ liệu phân loại
29. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Ngưỡng ý nghĩa thống kê được đặt ra trước khi kiểm định
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả mẫu, nếu giả thuyết null là đúng
D. Độ lớn của hiệu ứng trong mẫu
30. Phân phối chuẩn (normal distribution) có đặc điểm quan trọng nào sau đây?
A. Bị lệch sang phải
B. Không đối xứng
C. Đối xứng và hình chuông
D. Có nhiều mode