1. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm tra mối quan hệ tuyến tính giữa hai biến số.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba hoặc nhiều nhóm.
D. Ước lượng khoảng tin cậy cho trung bình tổng thể.
2. Phân phối nào sau đây thường được sử dụng để mô hình hóa thời gian cho đến khi một sự kiện xảy ra?
A. Phân phối chuẩn
B. Phân phối Poisson
C. Phân phối mũ
D. Phân phối nhị thức
3. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình cộng của tất cả các giá trị trong tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm chính giữa tập dữ liệu khi đã được sắp xếp theo thứ tự.
D. Độ lệch chuẩn của tập dữ liệu.
4. Khoảng tin cậy (confidence interval) 95% cho trung bình tổng thể có nghĩa là gì?
A. 95% các giá trị dữ liệu mẫu nằm trong khoảng này.
B. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
C. Có 95% khả năng trung bình tổng thể nằm trong khoảng này.
D. Khoảng này chứa 95% các trung bình mẫu có thể.
5. Chọn câu phát biểu đúng về mối quan hệ giữa phương sai và độ lệch chuẩn.
A. Phương sai là căn bậc hai của độ lệch chuẩn.
B. Độ lệch chuẩn là bình phương của phương sai.
C. Độ lệch chuẩn là căn bậc hai của phương sai.
D. Phương sai và độ lệch chuẩn là hai khái niệm hoàn toàn độc lập.
6. Trong một hộp có 5 viên bi đỏ và 3 viên bi xanh. Nếu bạn lấy ngẫu nhiên 2 viên bi, xác suất để cả hai viên bi đều màu đỏ là bao nhiêu?
A. 5/14
B. 10/56
C. 10/28
D. 25/64
7. Trong lý thuyết xác suất, hai sự kiện A và B được gọi là độc lập nếu:
A. Chúng không thể xảy ra đồng thời.
B. Sự xảy ra của sự kiện A ảnh hưởng đến xác suất xảy ra của sự kiện B.
C. Sự xảy ra của sự kiện A không ảnh hưởng đến xác suất xảy ra của sự kiện B.
D. Tổng xác suất của chúng bằng 1.
8. Phân phối nhị thức (Binomial distribution) mô tả số lần thành công trong một số lượng cố định các phép thử độc lập Bernoulli. Điều kiện nào sau đây KHÔNG cần thiết cho phân phối nhị thức?
A. Các phép thử phải độc lập với nhau.
B. Mỗi phép thử chỉ có hai kết quả có thể: thành công hoặc thất bại.
C. Xác suất thành công phải giống nhau trong mỗi phép thử.
D. Số lượng phép thử phải là một biến ngẫu nhiên.
9. Tính chất nào sau đây KHÔNG phải là tính chất của xác suất?
A. Xác suất của một sự kiện luôn nằm trong khoảng từ 0 đến 1.
B. Xác suất của không gian mẫu (tất cả các kết quả có thể) bằng 1.
C. Xác suất của hợp của hai sự kiện xung khắc bằng tổng xác suất của chúng.
D. Xác suất của sự kiện chắc chắn xảy ra bằng 0.
10. Phương sai (variance) của một biến ngẫu nhiên là gì?
A. Giá trị trung bình của biến ngẫu nhiên.
B. Căn bậc hai của độ lệch chuẩn.
C. Giá trị kỳ vọng của bình phương độ lệch của biến ngẫu nhiên so với giá trị trung bình của nó.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất của biến ngẫu nhiên.
11. Chọn cặp khái niệm tương phản đúng trong thống kê.
A. Trung bình và Phương sai
B. Độ lệch chuẩn và Trung vị
C. Thống kê mô tả và Thống kê suy diễn
D. Xác suất và Khoảng tin cậy
12. Giá trị kỳ vọng (expected value) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng của tất cả các giá trị có thể của biến ngẫu nhiên.
B. Giá trị trung vị của biến ngẫu nhiên.
C. Tổng của tích của mỗi giá trị có thể của biến ngẫu nhiên với xác suất tương ứng của nó.
D. Giá trị xuất hiện nhiều nhất của biến ngẫu nhiên.
13. Chọn phát biểu SAI về thống kê mô tả.
A. Thống kê mô tả được sử dụng để tóm tắt và mô tả các đặc điểm chính của tập dữ liệu.
B. Thống kê mô tả bao gồm các biện pháp như trung bình, trung vị, mốt và độ lệch chuẩn.
C. Thống kê mô tả cho phép chúng ta đưa ra kết luận về tổng thể dựa trên mẫu.
D. Biểu đồ, đồ thị và bảng biểu là công cụ thường được sử dụng trong thống kê mô tả.
14. Độ xiên (skewness) của phân phối dữ liệu cho biết điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ nhọn của đỉnh phân phối.
C. Mức độ bất đối xứng của phân phối.
D. Mức độ phân tán của dữ liệu.
15. Trong phân tích hồi quy tuyến tính đơn giản, mục tiêu chính là gì?
A. Mô tả phân phối của một biến số.
B. Kiểm tra sự khác biệt giữa trung bình của hai nhóm.
C. Mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc và một biến độc lập.
D. Tính xác suất của một sự kiện.
16. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất giả thuyết đối thuyết là đúng.
C. Xác suất quan sát được kết quả mẫu, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
D. Xác suất mắc lỗi Loại I.
17. Trong kiểm định giả thuyết, lỗi Loại I (Type I error) xảy ra khi nào?
A. Chúng ta bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chúng ta chấp nhận giả thuyết null khi nó thực sự sai.
C. Chúng ta không đưa ra quyết định về giả thuyết null.
D. Chúng ta thu thập dữ liệu không đủ để đưa ra kết luận.
18. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn
B. Phân phối nhị thức
C. Phân phối Poisson
D. Phân phối đều
19. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số.
B. Độ mạnh của mối quan hệ phi tuyến tính giữa hai biến số.
C. Sự khác biệt giữa giá trị trung bình của hai biến số.
D. Tỷ lệ phần trăm biến thiên của một biến số được giải thích bởi biến số kia.
20. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
B. Giá trị trung bình của tập dữ liệu.
C. Giá trị nằm rất xa so với các giá trị khác trong tập dữ liệu.
D. Giá trị nằm chính giữa tập dữ liệu sau khi sắp xếp.
21. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giữ nguyên mức độ tin cậy)?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi độ rộng.
22. Trong kiểm định giả thuyết, ý nghĩa thống kê (statistical significance) thường được xác định bởi ngưỡng alpha (α). Giá trị alpha phổ biến thường được sử dụng là bao nhiêu?
A. 0.1
B. 0.01
C. 0.05
D. 0.5
23. Phương pháp lấy mẫu nào đảm bảo rằng mỗi thành viên của tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu cụm
24. Khi nào thì trung bình mẫu (sample mean) là ước lượng không chệch (unbiased estimator) của trung bình tổng thể?
A. Luôn luôn, trung bình mẫu luôn là ước lượng không chệch.
B. Khi kích thước mẫu đủ lớn (theo Định lý giới hạn trung tâm).
C. Khi mẫu được chọn bằng phương pháp lấy mẫu ngẫu nhiên.
D. Khi tổng thể có phân phối chuẩn.
25. Chọn khẳng định SAI về Định lý giới hạn trung tâm (Central Limit Theorem).
A. Định lý giới hạn trung tâm chỉ áp dụng cho phân phối chuẩn gốc.
B. Định lý giới hạn trung tâm nói rằng phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn.
C. Kích thước mẫu 'đủ lớn' thường được coi là n ≥ 30.
D. Định lý giới hạn trung tâm rất quan trọng trong thống kê suy diễn.
26. Chọn câu phát biểu ĐÚNG về xác suất có điều kiện.
A. P(A|B) = P(A) * P(B)
B. P(A|B) = P(B|A)
C. P(A|B) = P(A và B) / P(B)
D. P(A|B) = P(A) + P(B) - P(A và B)
27. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung vị.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
28. Khi nào thì phân phối Student's t được sử dụng thay vì phân phối chuẩn (Z) trong kiểm định giả thuyết về trung bình?
A. Khi kích thước mẫu rất lớn (n > 1000).
B. Khi độ lệch chuẩn tổng thể đã biết.
C. Khi kích thước mẫu nhỏ và độ lệch chuẩn tổng thể chưa biết.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
29. Điều gì KHÔNG phải là một đặc điểm của phân phối chuẩn?
A. Đối xứng qua giá trị trung bình.
B. Hình dạng chuông.
C. Trung bình, trung vị và mốt bằng nhau.
D. Luôn luôn bị lệch phải.
30. Phân phối nào sau đây là phân phối rời rạc?
A. Phân phối chuẩn
B. Phân phối đều liên tục
C. Phân phối nhị thức
D. Phân phối mũ