1. Phân biệt giữa biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục.
A. Biến rời rạc có giá trị là số thực, biến liên tục có giá trị là số nguyên.
B. Biến rời rạc có thể đếm được các giá trị, biến liên tục nhận giá trị trong một khoảng.
C. Biến rời rạc luôn có phân phối nhị thức, biến liên tục luôn có phân phối chuẩn.
D. Biến rời rạc chỉ dùng cho dữ liệu định tính, biến liên tục dùng cho dữ liệu định lượng.
2. Kiểm định ANOVA (Analysis of Variance) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
3. Trong phân tích hồi quy bội (multiple regression), hệ số hồi quy riêng phần (partial regression coefficient) đo lường điều gì?
A. Mức độ phù hợp tổng thể của mô hình.
B. Sự thay đổi trong biến phụ thuộc khi một biến độc lập thay đổi một đơn vị, khi các biến độc lập khác được giữ không đổi.
C. Mức độ tương quan giữa các biến độc lập.
D. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
4. Mục đích của việc lấy mẫu ngẫu nhiên (random sampling) là gì?
A. Đảm bảo mẫu có kích thước lớn nhất có thể.
B. Giảm thiểu chi phí thu thập dữ liệu.
C. Tạo ra một mẫu đại diện cho популяції, giảm thiểu thiên vị và cho phép suy rộng kết quả từ mẫu lên популяції.
D. Chọn ra những đối tượng nghiên cứu dễ tiếp cận nhất.
5. Phân phối Student's t khác với phân phối chuẩn (Z) chủ yếu ở điểm nào?
A. Phân phối t đối xứng hơn phân phối Z.
B. Phân phối t có đuôi dày hơn phân phối Z, đặc biệt khi bậc tự do nhỏ.
C. Phân phối t chỉ áp dụng cho mẫu lớn, phân phối Z cho mẫu nhỏ.
D. Phân phối t có trung bình khác 0, phân phối Z luôn có trung bình bằng 0.
6. Khoảng tin cậy (confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số популяції.
B. Một khoảng giá trị mà tham số популяції có khả năng cao nằm trong đó.
C. Xác suất mà giả thuyết null là đúng.
D. Độ mạnh của mối quan hệ giữa các biến.
7. Khi nào thì nên sử dụng kiểm định t-test thay vì kiểm định z-test?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn популяції đã biết.
C. Khi độ lệch chuẩn популяції chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi muốn so sánh phương sai của hai популяції.
8. Điều kiện nào sau đây KHÔNG phải là điều kiện cần để sử dụng phân phối nhị thức (Binomial distribution)?
A. Mỗi phép thử phải độc lập với nhau.
B. Có một số lượng phép thử cố định.
C. Xác suất thành công phải thay đổi qua mỗi phép thử.
D. Mỗi phép thử chỉ có hai kết quả có thể: thành công hoặc thất bại.
9. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?
A. Số lần thành công trong một số lượng phép thử cố định.
B. Thời gian giữa các sự kiện liên tiếp.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Giá trị của một biến liên tục.
10. Biến ngẫu nhiên có phân phối Bernoulli mô tả loại phép thử nào?
A. Phép thử có nhiều hơn hai kết quả có thể.
B. Phép thử liên tục với kết quả là số thực.
C. Phép thử chỉ có hai kết quả có thể: thành công hoặc thất bại.
D. Số lần thành công trong một chuỗi phép thử.
11. Hệ số tương quan (correlation coefficient) Pearson đo lường điều gì?
A. Độ mạnh yếu của mối quan hệ nhân quả giữa hai biến.
B. Độ mạnh yếu và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt về trung bình giữa hai nhóm.
D. Tỷ lệ phần trăm biến thiên của một biến được giải thích bởi biến khác.
12. Giá trị kỳ vọng (kỳ vọng toán học) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng các giá trị có thể của biến.
B. Trung bình cộng của giá trị lớn nhất và nhỏ nhất.
C. Tổng của tích mỗi giá trị với xác suất tương ứng của nó.
D. Giá trị xuất hiện nhiều nhất của biến.
13. Khi nào thì sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không tuân theo phân phối chuẩn, mẫu nhỏ).
D. Khi muốn tính toán trung bình và độ lệch chuẩn.
14. Phân phối chuẩn (Normal distribution) có những đặc điểm chính nào?
A. Lệch phải, có hai đỉnh.
B. Đối xứng, hình chuông, trung bình, trung vị và mốt bằng nhau.
C. Lệch trái, đuôi bên phải kéo dài.
D. Hình chữ nhật, các giá trị có xác suất bằng nhau.
15. Trong kiểm định giả thuyết thống kê, lỗi loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
16. Mức ý nghĩa (significance level) α trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 0.5
B. 0.1
C. 0.05
D. 1.0
17. Hệ số xác định (R-squared) trong hồi quy tuyến tính biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi mô hình hồi quy.
D. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
18. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong dữ liệu.
D. Hình dạng phân phối của dữ liệu.
19. Phương sai (variance) được sử dụng để làm gì trong thống kê?
A. Đo lường xu hướng trung tâm của dữ liệu.
B. Đo lường sự phân tán của dữ liệu xung quanh giá trị trung bình.
C. Xác định hình dạng phân phối của dữ liệu.
D. Tính toán xác suất của các biến cố.
20. Trong thống kê, 'trung vị' (median) là gì?
A. Giá trị trung bình cộng của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp theo thứ tự.
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất.
21. Trong xác suất thống kê, biến cố sơ cấp là gì?
A. Một tập hợp con của không gian mẫu.
B. Một phép thử ngẫu nhiên.
C. Một kết quả không thể phân chia nhỏ hơn của một phép thử.
D. Toàn bộ không gian mẫu.
22. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số ngẫu nhiên trong mô hình.
23. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì quan trọng về phân phối trung bình mẫu?
A. Phân phối trung bình mẫu luôn là phân phối chuẩn, bất kể phân phối популяції.
B. Khi kích thước mẫu đủ lớn, phân phối trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể hình dạng phân phối популяції.
C. Trung bình của trung bình mẫu bằng với trung bình популяції.
D. Phương sai của trung bình mẫu bằng với phương sai популяції.
24. Thống kê mô tả (descriptive statistics) chủ yếu tập trung vào điều gì?
A. Dự đoán về популяції dựa trên mẫu.
B. Mô tả và tóm tắt các đặc điểm chính của tập dữ liệu.
C. Kiểm định giả thuyết về популяції.
D. Xây dựng mô hình quan hệ nhân quả giữa các biến.
25. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
26. Phân biệt giữa thống kê популяції (population statistics) và thống kê mẫu (sample statistics).
A. Thống kê популяції được tính từ mẫu, thống kê mẫu được tính từ популяції.
B. Thống kê популяції là các tham số mô tả toàn bộ популяції, thống kê mẫu là các tham số tương ứng tính từ mẫu để ước lượng tham số популяції.
C. Thống kê популяції luôn chính xác hơn thống kê mẫu.
D. Không có sự khác biệt giữa thống kê популяції và thống kê mẫu.
27. Trong phân tích phương sai (ANOVA), giả thuyết null (H0) thường là gì?
A. Trung bình của tất cả các nhóm đều khác nhau.
B. Phương sai của tất cả các nhóm đều bằng nhau.
C. Trung bình của ít nhất một cặp nhóm khác nhau.
D. Trung bình của tất cả các nhóm đều bằng nhau.
28. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của популяції.
B. Độ lệch chuẩn của trung bình mẫu từ trung bình популяції thực sự.
C. Phương sai của популяції.
D. Phương sai của trung bình mẫu.
29. Trong thống kê suy luận (inferential statistics), mục tiêu chính là gì?
A. Mô tả dữ liệu mẫu.
B. Rút ra kết luận hoặc suy luận về популяції dựa trên dữ liệu mẫu.
C. Tính toán các số đo xu hướng trung tâm.
D. Trình bày dữ liệu bằng đồ thị.
30. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Mức độ quan trọng thực tế của kết quả.