1. Trong thống kê ứng dụng, loại biến nào thường được sử dụng để đo lường mức độ hài lòng của khách hàng, được biểu diễn bằng các mức độ như 'Rất hài lòng′, 'Hài lòng′, 'Bình thường′, 'Không hài lòng′, 'Rất không hài lòng′?
A. Biến định lượng liên tục
B. Biến định tính thứ bậc (Ordinal)
C. Biến định lượng rời rạc
D. Biến định tính danh nghĩa (Nominal)
2. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng
B. Không bác bỏ giả thuyết null khi nó sai
C. Chọn mẫu không đại diện
D. Tính toán thống kê sai
3. Ý nghĩa của việc tính toán 'khoảng tin cậy′ (confidence interval) là gì?
A. Ước tính chính xác giá trị tham số tổng thể
B. Cung cấp một khoảng giá trị mà tham số tổng thể có khả năng nằm trong với một độ tin cậy nhất định
C. Kiểm định giả thuyết về tham số tổng thể
D. Xác định kích thước mẫu cần thiết
4. Độ mạnh của kiểm định (power of a test) là gì?
A. Xác suất mắc sai số loại I
B. Xác suất mắc sai số loại II
C. Xác suất bác bỏ đúng giả thuyết null khi nó sai
D. Xác suất không bác bỏ giả thuyết null khi nó đúng
5. Phương pháp thống kê nào thường được dùng để giảm chiều dữ liệu (dimensionality reduction)?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy (Regression Analysis)
C. Phân tích thành phần chính (Principal Component Analysis - PCA)
D. Kiểm định t (t-test)
6. Trong thống kê Bayesian, 'xác suất tiên nghiệm′ (prior probability) đại diện cho điều gì?
A. Xác suất được tính toán từ dữ liệu mẫu
B. Xác suất ban đầu, trước khi xem xét dữ liệu mẫu, về một giả thuyết hoặc tham số
C. Xác suất sau khi đã cập nhật thông tin từ dữ liệu mẫu
D. Ngưỡng ý nghĩa thống kê
7. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc lẫn nhau giữa hai biến
B. Mức độ biến thiên của một biến
C. Mức độ quan hệ tuyến tính giữa hai biến định lượng
D. Mức độ phù hợp của mô hình hồi quy
8. Khi phân tích dữ liệu khảo sát, 'tỷ lệ phản hồi′ (response rate) thấp có thể dẫn đến vấn đề gì?
A. Tăng độ chính xác của ước tính
B. Giảm sai số chọn mẫu
C. Sai lệch do không phản hồi (non-response bias), làm giảm tính đại diện của mẫu
D. Không ảnh hưởng đến kết quả phân tích
9. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. So sánh trung bình của hai mẫu độc lập
B. So sánh trung vị của hai mẫu liên quan (paired samples) khi dữ liệu không phân phối chuẩn
C. Kiểm định sự khác biệt giữa trung bình của nhiều nhóm
D. Phân tích mối quan hệ tuyến tính
10. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. Ước tính trung bình tổng thể
B. Kiểm định sự khác biệt giữa trung bình của hai nhóm
C. Kiểm định sự khác biệt giữa trung bình của ba nhóm trở lên
D. Đo lường mối quan hệ giữa hai biến định lượng
11. Trong phân tích hồi quy tuyến tính đơn, biến độc lập và biến phụ thuộc có mối quan hệ như thế nào?
A. Biến phụ thuộc dự đoán biến độc lập
B. Biến độc lập ảnh hưởng đến biến phụ thuộc
C. Hai biến không liên quan
D. Hai biến cùng ảnh hưởng đến một biến thứ ba
12. Phương pháp 'bootstrap′ trong thống kê được sử dụng để làm gì?
A. Ước tính tham số tổng thể trực tiếp từ mẫu
B. Ước tính độ lệch chuẩn và khoảng tin cậy của thống kê mẫu bằng cách lấy mẫu lại có hoàn lại từ mẫu gốc
C. Kiểm định giả thuyết về trung bình tổng thể
D. Phân tích phương sai
13. Phương pháp 'lấy mẫu phân tầng′ (stratified sampling) được sử dụng khi nào?
A. Khi tổng thể đồng nhất
B. Khi muốn đảm bảo tính đại diện của các nhóm (strata) khác nhau trong tổng thể
C. Khi không có danh sách đầy đủ các phần tử của tổng thể
D. Khi muốn tiết kiệm chi phí và thời gian thu thập dữ liệu
14. Trong phân tích sống còn (survival analysis), 'hàm sống sót′ (survival function) S(t) biểu thị điều gì?
A. Thời gian sống trung bình
B. Xác suất một đối tượng sống sót ít nhất đến thời điểm t
C. Tỷ lệ tử vong tại thời điểm t
D. Thời gian sống dài nhất quan sát được
15. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Chia đều ở cả hai đuôi của phân phối
B. Chỉ nằm ở một đuôi của phân phối (đuôi bên phải hoặc bên trái)
C. Nằm ở giữa phân phối
D. Không có vùng bác bỏ trong kiểm định một đuôi
16. Trong phân tích dữ liệu lớn (Big Data), phương pháp thống kê nào thường được sử dụng để khám phá các mẫu ẩn và mối quan hệ phức tạp?
A. Thống kê mô tả cơ bản
B. Phân tích hồi quy tuyến tính đơn
C. Khai phá dữ liệu (Data Mining) và học máy (Machine Learning)
D. Kiểm định t (t-test) độc lập
17. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu theo cụm
18. Trong thống kê ứng dụng, 'dữ liệu bảng′ (panel data) là loại dữ liệu gì?
A. Dữ liệu thu thập tại một thời điểm duy nhất
B. Dữ liệu chuỗi thời gian
C. Dữ liệu kết hợp cả chuỗi thời gian và dữ liệu cắt ngang (cross-sectional), theo dõi nhiều đối tượng qua nhiều thời kỳ
D. Dữ liệu chỉ bao gồm biến định tính
19. Trong kiểm định giả thuyết, 'giá trị p′ (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Ngưỡng ý nghĩa thống kê
C. Xác suất quan sát được kết quảExtreme như (hoặc hơn) kết quả mẫu, giả sử giả thuyết null đúng
D. Sai số loại I
20. Khi nào việc sử dụng phương pháp thống kê phi tham số là phù hợp hơn so với phương pháp tham số?
A. Khi dữ liệu có phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ
D. Khi muốn ước tính tham số tổng thể
21. Trong phân tích rủi ro, 'giá trị kỳ vọng′ (expected value) được tính như thế nào?
A. Giá trị trung bình của các kết quả có thể xảy ra
B. Tổng của tích các kết quả có thể xảy ra với xác suất tương ứng của chúng
C. Giá trị có khả năng xảy ra cao nhất
D. Giá trị trung vị của các kết quả có thể xảy ra
22. Phương pháp thống kê nào được sử dụng để ước tính giá trị trung bình của tổng thể dựa trên thông tin từ một mẫu ngẫu nhiên?
A. Thống kê mô tả
B. Thống kê suy diễn
C. Phân tích hồi quy
D. Kiểm định giả thuyết
23. Trong thống kê ứng dụng, thuật ngữ 'ngoại suy′ (extrapolation) có nghĩa là gì?
A. Ước tính giá trị bên trong phạm vi dữ liệu đã quan sát
B. Ước tính giá trị bên ngoài phạm vi dữ liệu đã quan sát, dựa trên mô hình hoặc xu hướng hiện có
C. Loại bỏ dữ liệu ngoại lai
D. Chuyển đổi dữ liệu định tính thành định lượng
24. Khi nào thì 'trung vị' (median) là thước đo xu hướng trung tâm tốt hơn 'trung bình′ (mean)?
A. Khi dữ liệu có phân phối chuẩn
B. Khi dữ liệu không có giá trị ngoại lai
C. Khi dữ liệu bị lệch (skewed) hoặc có giá trị ngoại lai
D. Khi kích thước mẫu lớn
25. Trong phân tích hồi quy đa biến, 'đa cộng tuyến′ (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến tính giữa các biến
B. Sự tương quan cao giữa các biến độc lập, gây khó khăn cho việc xác định ảnh hưởng riêng rẽ của từng biến
C. Sự phụ thuộc của biến phụ thuộc vào thời gian
D. Sự biến động lớn của sai số
26. Phân phối chuẩn (Normal distribution) có đặc điểm quan trọng nào trong thống kê ứng dụng?
A. Luôn đối xứng và có trung vị bằng trung bình
B. Là phân phối duy nhất được sử dụng trong thống kê suy diễn
C. Xuất hiện phổ biến trong tự nhiên và là cơ sở cho nhiều kiểm định tham số
D. Chỉ áp dụng cho biến định tính
27. Trong thống kê mô tả, 'phương sai′ (variance) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu
B. Độ lệch trung bình tuyệt đối
C. Độ phân tán của dữ liệu xung quanh giá trị trung bình
D. Mức độ bất đối xứng của phân phối
28. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-squared test)?
A. So sánh trung bình của hai mẫu độc lập
B. Kiểm định sự phù hợp của phân phối thực nghiệm với phân phối lý thuyết hoặc kiểm định tính độc lập giữa các biến định tính
C. Phân tích mối quan hệ tuyến tính giữa hai biến định lượng
D. Ước tính trung bình tổng thể
29. Mục đích chính của việc 'chuẩn hóa dữ liệu′ (data normalization) trong thống kê là gì?
A. Loại bỏ giá trị ngoại lai
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn
C. Tăng độ chính xác của dữ liệu
D. Làm cho dữ liệu tuân theo phân phối chuẩn
30. Trong phân tích chuỗi thời gian, thành phần 'xu hướng′ (trend) mô tả điều gì?
A. Biến động ngắn hạn và ngẫu nhiên
B. Sự biến động theo mùa
C. Sự thay đổi dài hạn và có hướng của chuỗi số liệu
D. Các yếu tố bất thường, đột biến