1. Trong thống kê mô tả, 'phương sai′ được sử dụng để làm gì?
A. Đo lường giá trị trung tâm của dữ liệu.
B. Đo lường sự phân tán của dữ liệu xung quanh giá trị trung bình.
C. Xác định hình dạng phân phối của dữ liệu.
D. Tính tổng các giá trị dữ liệu.
2. Phương pháp Monte Carlo được sử dụng chủ yếu để làm gì trong thống kê?
A. Giải các bài toán tối ưu hóa.
B. Mô phỏng và ước tính kết quả số cho các mô hình phức tạp thông qua lấy mẫu ngẫu nhiên.
C. Phân tích dữ liệu chuỗi thời gian.
D. Kiểm định giả thuyết về phân phối dữ liệu.
3. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Tất cả các trung bình tổng thể đều khác nhau.
B. Ít nhất một trung bình tổng thể khác với các trung bình còn lại.
C. Tất cả các trung bình tổng thể đều bằng nhau.
D. Phương sai giữa các nhóm lớn hơn phương sai trong nội bộ nhóm.
4. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của một biến.
B. Mức độ quan hệ phi tuyến tính giữa hai biến.
C. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
D. Mức độ khác biệt giữa hai biến định tính.
5. Trong hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị điều gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
C. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
D. Độ mạnh của mối quan hệ tuyến tính.
6. Mức ý nghĩa (significance level) α trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 10%
B. 20%
C. 5%
D. 50%
7. Trong lý thuyết xác suất, biến cố sơ cấp là gì?
A. Một tập hợp con của không gian mẫu.
B. Một phép thử ngẫu nhiên.
C. Một kết quả không thể phân chia nhỏ hơn trong không gian mẫu.
D. Một biến cố chắc chắn xảy ra.
8. Hệ số xác định R-squared trong hồi quy bội đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Giá trị trung bình của biến phụ thuộc khi tất cả biến độc lập bằng 0.
D. Sai số chuẩn của mô hình hồi quy.
9. Phép thử Bernoulli là một phép thử ngẫu nhiên có đặc điểm nào sau đây?
A. Có vô số kết quả có thể xảy ra.
B. Chỉ có hai kết quả có thể xảy ra: thành công hoặc thất bại.
C. Các kết quả có xác suất bằng nhau.
D. Các kết quả phải độc lập với nhau.
10. Khi so sánh hai mẫu độc lập, kiểm định nào sau đây phù hợp để kiểm tra sự khác biệt về trung bình nếu dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t hai mẫu độc lập.
B. Kiểm định z hai mẫu độc lập.
C. Kiểm định Mann-Whitney U.
D. Phân tích phương sai (ANOVA).
11. Trung vị (median) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ở vị trí chính giữa của tập dữ liệu đã sắp xếp.
D. Tổng của tất cả các giá trị trong tập dữ liệu chia cho số lượng giá trị.
12. Phân phối Poisson thường được sử dụng để mô hình hóa sự kiện nào?
A. Số lần thành công trong một số phép thử cố định.
B. Thời gian giữa các sự kiện.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Tỷ lệ phần trăm của một đặc điểm trong tổng thể.
13. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả và tóm tắt dữ liệu mẫu.
B. Thu thập dữ liệu từ tổng thể.
C. Đưa ra kết luận về tổng thể dựa trên dữ liệu mẫu.
D. Trình bày dữ liệu dưới dạng bảng và biểu đồ.
14. Phân phối chuẩn (Gaussian) có đặc điểm quan trọng nào sau đây?
A. Đối xứng và có hai đỉnh.
B. Bất đối xứng và có một đỉnh.
C. Đối xứng và có một đỉnh, trung bình, trung vị và mốt bằng nhau.
D. Luôn có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1.
15. Trong phân phối nhị thức, điều kiện nào sau đây KHÔNG đúng?
A. Mỗi phép thử là độc lập.
B. Xác suất thành công trong mỗi phép thử là như nhau.
C. Số phép thử là cố định.
D. Các phép thử phải phụ thuộc lẫn nhau.
16. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng của các giá trị có thể nhân với xác suất của chúng.
B. Giá trị trung bình của các giá trị có thể.
C. Giá trị xuất hiện nhiều nhất.
D. Giá trị trung vị của các giá trị có thể.
17. Ưu điểm chính của việc sử dụng thống kê phi tham số là gì?
A. Yêu cầu dữ liệu phải tuân theo phân phối chuẩn.
B. Không yêu cầu các giả định nghiêm ngặt về phân phối của dữ liệu.
C. Luôn cho kết quả chính xác hơn thống kê tham số.
D. Dễ tính toán hơn và ít phức tạp hơn thống kê tham số.
18. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả đã quan sát, giả sử giả thuyết null đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất giả thuyết null là đúng.
19. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của tổng thể đã biết.
C. Khi độ lệch chuẩn của tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi muốn so sánh hai trung bình mẫu độc lập với nhau.
20. Trong lý thuyết ước lượng, tính chất 'vững′ (consistent) của một ước lượng có nghĩa là gì?
A. Ước lượng luôn bằng tham số tổng thể.
B. Khi kích thước mẫu tăng lên, ước lượng hội tụ về tham số tổng thể thực sự.
C. Ước lượng có phương sai nhỏ nhất trong số các ước lượng không chệch.
D. Ước lượng không bị ảnh hưởng bởi các giá trị ngoại lệ.
21. Phương pháp lấy mẫu ngẫu nhiên đơn giản đảm bảo điều gì?
A. Mỗi phần tử trong mẫu có xác suất được chọn khác nhau.
B. Mỗi phần tử trong tổng thể có xác suất được chọn bằng nhau.
C. Mẫu thu được phải phản ánh chính xác tỷ lệ các nhóm trong tổng thể.
D. Mẫu thu được phải có kích thước lớn nhất có thể.
22. Trong phân tích chuỗi thời gian, thành phần 'xu hướng′ (trend) đề cập đến điều gì?
A. Biến động ngắn hạn và ngẫu nhiên trong dữ liệu.
B. Mô hình biến động theo mùa lặp đi lặp lại.
C. Sự thay đổi dài hạn và nhất quán của dữ liệu theo thời gian.
D. Các sự kiện bất thường và đột ngột ảnh hưởng đến dữ liệu.
23. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng giá trị tham số thực nằm ngoài khoảng tin cậy.
B. Có 95% khả năng mẫu được chọn sẽ tạo ra khoảng tin cậy chứa tham số thực.
C. Có 95% khả năng giá trị trung bình mẫu bằng giá trị trung bình tổng thể.
D. Khoảng tin cậy chứa 95% dữ liệu mẫu.
24. Độ lệch chuẩn đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung vị.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị trung bình của dữ liệu.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu.
25. Phương pháp Bootstrap trong thống kê được sử dụng để làm gì?
A. Kiểm định giả thuyết về trung bình tổng thể.
B. Ước tính phương sai của tổng thể.
C. Ước tính sai số chuẩn và khoảng tin cậy bằng cách lấy mẫu lại từ dữ liệu mẫu.
D. Xác định phân phối xác suất của tổng thể.
26. Biến ngẫu nhiên liên tục khác biến ngẫu nhiên rời rạc ở điểm nào?
A. Biến liên tục chỉ nhận giá trị nguyên, biến rời rạc nhận giá trị thực.
B. Biến liên tục có thể nhận bất kỳ giá trị nào trong một khoảng, biến rời rạc chỉ nhận giá trị đếm được.
C. Biến liên tục có phân phối nhị thức, biến rời rạc có phân phối chuẩn.
D. Biến liên tục không có giá trị kỳ vọng, biến rời rạc có giá trị kỳ vọng.
27. Trong kiểm định giả thuyết thống kê, lỗi loại I xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó đúng.
D. Bác bỏ giả thuyết null khi nó sai.
28. Khái niệm 'phương sai có điều kiện′ (conditional variance) trong xác suất đo lường điều gì?
A. Phương sai của một biến ngẫu nhiên khi không có điều kiện nào ràng buộc.
B. Phương sai của một biến ngẫu nhiên khi biết giá trị của một biến ngẫu nhiên khác.
C. Hiệp phương sai giữa hai biến ngẫu nhiên.
D. Phương sai của tổng hai biến ngẫu nhiên.
29. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của tổng thể.
B. Độ lệch chuẩn của dữ liệu mẫu.
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
D. Sai số do đo lường không chính xác.
30. Mục đích chính của việc lấy mẫu thống kê là gì?
A. Thu thập dữ liệu từ toàn bộ tổng thể.
B. Ước tính các đặc trưng của tổng thể dựa trên một phần nhỏ của nó.
C. Tăng độ chính xác của phép đo lường.
D. Giảm chi phí thu thập dữ liệu bằng cách khảo sát tất cả các đơn vị.