1. Phân phối chuẩn có đặc điểm quan trọng nào sau đây?
A. Bất đối xứng và có hai đỉnh.
B. Đối xứng, hình chuông và được xác định bởi trung bình và độ lệch chuẩn.
C. Phân phối rời rạc.
D. Luôn có trung bình bằng 0 và độ lệch chuẩn bằng 1.
2. Loại biểu đồ nào thích hợp nhất để thể hiện tần suất của các hạng mục rời rạc?
A. Biểu đồ phân tán.
B. Biểu đồ đường.
C. Biểu đồ cột.
D. Biểu đồ hộp.
3. Phân phối nào sau đây thường được sử dụng làm xấp xỉ cho phân phối nhị thức khi số thử nghiệm lớn và xác suất thành công nhỏ?
A. Phân phối chuẩn
B. Phân phối Poisson
C. Phân phối mũ
D. Phân phối đều
4. Khi nào thì trung vị (median) là thước đo trung tâm tốt hơn so với trung bình (mean)?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu rời rạc.
D. Khi cần tính toán nhanh.
5. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó sai.
B. Không bác bỏ giả thuyết null khi nó đúng.
C. Bác bỏ giả thuyết null khi nó đúng.
D. Không bác bỏ giả thuyết null khi nó sai.
6. Trong một hộp có 5 bi đỏ và 3 bi xanh. Nếu bạn chọn ngẫu nhiên 2 bi mà không hoàn lại, xác suất để cả hai bi đều màu đỏ là bao nhiêu?
A. 5∕14
B. 10∕28
C. 10∕56
D. 10∕28
7. Trong kiểm định giả thuyết, mức ý nghĩa (alpha, α) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất sai lầm loại II là 5%.
B. Có 5% khả năng chấp nhận giả thuyết null khi nó sai.
C. Có 5% khả năng bác bỏ giả thuyết null khi nó đúng (sai lầm loại I).
D. Độ tin cậy của kiểm định là 95%.
8. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính bằng công thức nào?
A. Tổng của tích mỗi giá trị với xác suất của nó.
B. Giá trị trung bình của các quan sát.
C. Giá trị xuất hiện nhiều nhất.
D. Độ lệch chuẩn của biến ngẫu nhiên.
9. Biến ngẫu nhiên rời rạc nào sau đây thường được sử dụng để mô hình hóa số lần thành công trong một chuỗi các thử nghiệm độc lập Bernoulli?
A. Phân phối Poisson
B. Phân phối chuẩn
C. Phân phối nhị thức
D. Phân phối mũ
10. Giá trị 'mode′ (mốt) trong thống kê là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị nằm giữa tập dữ liệu đã sắp xếp.
C. Giá trị xuất hiện nhiều lần nhất trong tập dữ liệu.
D. Độ lệch chuẩn của tập dữ liệu.
11. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong dữ liệu.
D. Giá trị nhỏ nhất trong dữ liệu.
12. Phương pháp lấy mẫu phân tầng (stratified sampling) được sử dụng khi nào?
A. Khi quần thể đồng nhất.
B. Khi muốn đảm bảo đại diện từ các nhóm con (strata) khác nhau trong quần thể.
C. Khi cỡ mẫu rất lớn.
D. Khi không có danh sách đầy đủ của quần thể.
13. Phân phối nào sau đây liên quan đến việc mô hình hóa thời gian giữa các sự kiện trong một quá trình Poisson?
A. Phân phối nhị thức.
B. Phân phối chuẩn.
C. Phân phối mũ.
D. Phân phối Poisson.
14. Chọn khẳng định đúng về xác suất có điều kiện P(A|B).
A. P(A|B) = P(A ∩ B) ∕ P(A)
B. P(A|B) = P(B) ∕ P(A ∩ B)
C. P(A|B) = P(A ∩ B) ∕ P(B)
D. P(A|B) = P(A) ∕ P(A ∩ B)
15. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Phân phối của quần thể luôn là phân phối chuẩn.
B. Trung bình mẫu luôn bằng trung bình quần thể.
C. Phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi cỡ mẫu đủ lớn, bất kể phân phối gốc của quần thể.
D. Phương sai mẫu luôn bằng phương sai quần thể.
16. Trong thống kê suy diễn, chúng ta sử dụng thông tin từ mẫu để làm gì?
A. Tính toán chính xác các tham số quần thể.
B. Mô tả đặc điểm của mẫu.
C. Ước lượng và kiểm định các giả thuyết về tham số quần thể.
D. Trình bày dữ liệu mẫu một cách trực quan.
17. Chọn khẳng định SAI về phân phối Poisson.
A. Trung bình và phương sai của phân phối Poisson bằng nhau.
B. Phân phối Poisson mô tả số sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Các sự kiện trong phân phối Poisson phải xảy ra độc lập với nhau.
D. Phân phối Poisson là phân phối liên tục.
18. Trong phân tích hồi quy tuyến tính đơn giản, mục tiêu chính là gì?
A. Dự đoán giá trị của biến độc lập.
B. Mô tả mối quan hệ phi tuyến giữa hai biến.
C. Mô hình hóa mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập.
D. Tính toán hệ số tương quan giữa các biến.
19. Thí nghiệm Bernoulli là gì?
A. Thí nghiệm có nhiều hơn hai kết quả có thể.
B. Thí nghiệm được lặp lại nhiều lần.
C. Thí nghiệm chỉ có hai kết quả có thể: thành công hoặc thất bại.
D. Thí nghiệm có kết quả liên tục.
20. Hệ số tương quan Pearson đo lường điều gì giữa hai biến định lượng?
A. Mối quan hệ nhân quả.
B. Mức độ biến thiên của một biến.
C. Độ mạnh và hướng của mối quan hệ tuyến tính.
D. Sự khác biệt giữa giá trị trung bình của hai biến.
21. Giá trị hiệp phương sai (covariance) giữa hai biến X và Y cho biết điều gì?
A. Độ mạnh của mối quan hệ tuyến tính chuẩn hóa.
B. Hướng của mối quan hệ tuyến tính (dương hoặc âm).
C. Tỷ lệ thay đổi của Y khi X thay đổi một đơn vị.
D. Mức độ phân tán của dữ liệu của biến X.
22. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Kiểm định sự khác biệt giữa hai trung bình.
B. Phân tích mối quan hệ giữa hai biến định lượng.
C. Kiểm định sự khác biệt giữa trung bình của ba nhóm trở lên.
D. Đo lường độ phân tán của dữ liệu.
23. Chọn phát biểu đúng về trung bình mẫu và trung bình quần thể.
A. Trung bình mẫu luôn bằng trung bình quần thể.
B. Trung bình mẫu là một ước lượng điểm của trung bình quần thể.
C. Trung bình quần thể thay đổi theo mỗi mẫu.
D. Trung bình mẫu là tham số quần thể.
24. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm đi.
C. Độ rộng khoảng tin cậy không đổi.
D. Không có mối quan hệ rõ ràng.
25. Trong kiểm định một đuôi (one-tailed test), vùng bác bỏ nằm ở đâu?
A. Ở cả hai phía của phân phối lấy mẫu.
B. Chỉ ở một phía của phân phối lấy mẫu.
C. Luôn ở trung tâm của phân phối lấy mẫu.
D. Không có vùng bác bỏ trong kiểm định một đuôi.
26. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến ngẫu nhiên.
B. Độ lệch chuẩn của biến ngẫu nhiên.
C. Mức độ phân tán trung bình của các giá trị xung quanh giá trị trung bình.
D. Giá trị lớn nhất có thể của biến ngẫu nhiên.
27. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Ngưỡng ý nghĩa của kiểm định.
C. Xác suất quan sát được kết quả cực đoan ít nhất bằng kết quả mẫu, giả sử giả thuyết null đúng.
D. Xác suất sai lầm loại II.
28. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Độ lệch chuẩn của phần dư.
29. Khoảng tin cậy 95% cho trung bình quần thể có nghĩa là gì?
A. 95% dữ liệu mẫu nằm trong khoảng này.
B. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
C. Có 95% khả năng trung bình quần thể thực sự nằm trong khoảng này.
D. Khoảng này chứa 95% giá trị có thể của trung bình quần thể.
30. Một mẫu ngẫu nhiên được coi là đại diện cho quần thể khi nào?
A. Khi kích thước mẫu rất lớn.
B. Khi mẫu được chọn theo cách mà mọi đơn vị trong quần thể có cơ hội được chọn như nhau.
C. Khi mẫu chỉ bao gồm các đơn vị dễ tiếp cận nhất.
D. Khi mẫu có phương sai nhỏ.