1. Điều gì xảy ra với sai số chuẩn của trung bình (standard error of the mean) khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không đổi.
D. Không thể xác định.
2. Hệ số tương quan (correlation coefficient) $r = -1$ cho biết điều gì?
A. Không có mối tương quan tuyến tính giữa hai biến.
B. Mối tương quan tuyến tính hoàn hảo và dương giữa hai biến.
C. Mối tương quan tuyến tính hoàn hảo và âm giữa hai biến.
D. Có lỗi trong tính toán.
3. Lỗi loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết $H_0$ khi $H_0$ sai.
B. Bác bỏ giả thuyết $H_0$ khi $H_0$ đúng.
C. Chấp nhận giả thuyết $H_0$ khi $H_0$ đúng.
D. Bác bỏ giả thuyết $H_0$ khi $H_0$ sai.
4. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Thời gian giữa các sự kiện.
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Phân phối của các biến liên tục.
D. Phân phối của các biến nhị phân.
5. Trong kiểm định giả thuyết thống kê, mức ý nghĩa ($alpha$) thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết $H_0$ khi $H_0$ đúng.
C. Xác suất chấp nhận giả thuyết $H_0$ khi $H_0$ sai.
D. Xác suất chấp nhận giả thuyết $H_0$ khi $H_0$ đúng.
6. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi so sánh hai quần thể có phương sai bằng nhau.
7. Phương pháp Bootstrap trong thống kê được sử dụng để làm gì?
A. Giảm kích thước mẫu.
B. Ước lượng phương sai và khoảng tin cậy bằng cách lấy mẫu lại từ dữ liệu gốc.
C. Kiểm tra tính chuẩn của dữ liệu.
D. Tính toán giá trị p một cách chính xác hơn.
8. Giá trị p (p-value) trong kiểm định giả thuyết có ý nghĩa gì?
A. Xác suất giả thuyết $H_0$ đúng.
B. Xác suất mắc lỗi loại II.
C. Xác suất thu được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết $H_0$ đúng.
D. Xác suất bác bỏ giả thuyết $H_0$ khi $H_0$ sai.
9. Tỷ số rủi ro (hazard ratio - HR) trong phân tích sống còn được sử dụng để so sánh điều gì?
A. So sánh thời gian sống trung bình giữa hai nhóm.
B. So sánh tỷ lệ sống sót tại một thời điểm cụ thể giữa hai nhóm.
C. So sánh rủi ro tương đối của biến cố (ví dụ: tử vong) giữa hai nhóm.
D. So sánh tổng số biến cố xảy ra trong hai nhóm.
10. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) $S(t)$ biểu thị điều gì?
A. Xác suất một cá nhân chết tại thời điểm $t$.
B. Xác suất một cá nhân sống sót đến thời điểm $t$.
C. Thời gian sống trung bình của một cá nhân.
D. Tỷ lệ tử vong tại thời điểm $t$.
11. Trong phân tích phương sai (ANOVA), giả thuyết null ($H_0$) thường là gì?
A. Tất cả các phương sai của các nhóm đều khác nhau.
B. Ít nhất một cặp trung bình của các nhóm khác nhau.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Tất cả các trung bình của các nhóm đều khác nhau.
12. Độ nhạy (sensitivity) của một xét nghiệm y tế là gì?
A. Xác suất một người không mắc bệnh có kết quả xét nghiệm âm tính.
B. Xác suất một người mắc bệnh có kết quả xét nghiệm dương tính.
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
13. Trong hồi quy tuyến tính, $R^2$ (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Giá trị p của mô hình.
14. Lỗi loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Chấp nhận giả thuyết $H_0$ khi $H_0$ sai.
B. Bác bỏ giả thuyết $H_0$ khi $H_0$ đúng.
C. Chấp nhận giả thuyết $H_0$ khi $H_0$ đúng.
D. Bác bỏ giả thuyết $H_0$ khi $H_0$ sai.
15. Phân phối chuẩn (normal distribution) có những đặc điểm nào?
A. Bất đối xứng và có một đỉnh.
B. Đối xứng và có nhiều đỉnh.
C. Bất đối xứng và có nhiều đỉnh.
D. Đối xứng và có một đỉnh.
16. Độ mạnh của một kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc lỗi loại I.
B. Xác suất mắc lỗi loại II.
C. Xác suất bác bỏ giả thuyết $H_0$ khi $H_0$ sai.
D. Xác suất chấp nhận giả thuyết $H_0$ khi $H_0$ đúng.
17. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Phân tích phương sai.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Kiểm tra tương quan giữa hai biến định lượng.
18. Nếu một xét nghiệm có độ nhạy và độ đặc hiệu cao, điều gì có thể xảy ra với giá trị tiên đoán dương (PPV) khi tỷ lệ hiện mắc của bệnh thấp?
A. PPV sẽ tăng.
B. PPV sẽ giảm.
C. PPV sẽ không thay đổi.
D. Không thể xác định.
19. Một nghiên cứu bệnh chứng (case-control study) thường được sử dụng để làm gì?
A. Xác định tỷ lệ hiện mắc của một bệnh tại một thời điểm cụ thể.
B. Xác định nguyên nhân gây ra một bệnh.
C. Đánh giá hiệu quả của một phương pháp điều trị.
D. So sánh những người mắc bệnh (ca bệnh) với những người không mắc bệnh (chứng) để xác định các yếu tố nguy cơ.
20. Phương pháp Mantel-Haenszel được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính khi có biến gây nhiễu.
C. Phân tích phương sai.
D. Kiểm tra tương quan giữa hai biến định lượng.
21. Độ đặc hiệu (specificity) của một xét nghiệm y tế là gì?
A. Xác suất một người không mắc bệnh có kết quả xét nghiệm âm tính.
B. Xác suất một người mắc bệnh có kết quả xét nghiệm dương tính.
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
22. Trong thống kê Bayesian, điều gì đại diện cho "prior"?
A. Dữ liệu quan sát được.
B. Xác suất của giả thuyết sau khi xem xét dữ liệu.
C. Xác suất ban đầu của giả thuyết trước khi xem xét dữ liệu.
D. Hàm правдоподобия (likelihood function).
23. Định lý giới hạn trung tâm (central limit theorem) phát biểu điều gì?
A. Tổng của các biến ngẫu nhiên độc lập có phân phối chuẩn.
B. Trung bình mẫu của một quần thể bất kỳ sẽ có phân phối chuẩn khi kích thước mẫu đủ lớn.
C. Phương sai của mẫu luôn bằng phương sai của quần thể.
D. Kích thước mẫu càng lớn, phương sai của mẫu càng lớn.
24. Ý nghĩa của odds ratio (OR) bằng 1 là gì?
A. Có mối liên hệ nhân quả mạnh mẽ giữa yếu tố nguy cơ và bệnh.
B. Không có mối liên hệ giữa yếu tố nguy cơ và bệnh.
C. Yếu tố nguy cơ bảo vệ khỏi bệnh.
D. Có mối liên hệ tỷ lệ nghịch giữa yếu tố nguy cơ và bệnh.
25. Giá trị tiên đoán dương (positive predictive value - PPV) của một xét nghiệm y tế là gì?
A. Xác suất một người không mắc bệnh có kết quả xét nghiệm âm tính.
B. Xác suất một người mắc bệnh có kết quả xét nghiệm dương tính.
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
26. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng khoảng tin cậy không đổi.
B. Độ rộng khoảng tin cậy tăng lên.
C. Độ rộng khoảng tin cậy giảm xuống.
D. Không thể xác định.
27. Một nghiên cứu đoàn hệ (cohort study) thường được sử dụng để làm gì?
A. Xác định tỷ lệ hiện mắc của một bệnh tại một thời điểm cụ thể.
B. Xác định nguyên nhân gây ra một bệnh.
C. Đánh giá hiệu quả của một phương pháp điều trị.
D. Theo dõi một nhóm người theo thời gian để xem ai phát triển bệnh và xác định các yếu tố nguy cơ.
28. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ (outliers).
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn.
C. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Tăng kích thước mẫu.
29. Giá trị tiên đoán âm (negative predictive value - NPV) của một xét nghiệm y tế là gì?
A. Xác suất một người không mắc bệnh có kết quả xét nghiệm âm tính.
B. Xác suất một người mắc bệnh có kết quả xét nghiệm dương tính.
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
30. Chọn câu phát biểu đúng về khoảng tin cậy (confidence interval).
A. Khoảng tin cậy là khoảng giá trị mà tham số thực sự của quần thể chắc chắn nằm trong đó.
B. Khoảng tin cậy càng rộng, độ chính xác ước lượng càng cao.
C. Khoảng tin cậy là khoảng giá trị mà mẫu được chọn ngẫu nhiên chắc chắn nằm trong đó.
D. Khoảng tin cậy là khoảng giá trị mà chúng ta tin rằng tham số thực sự của quần thể nằm trong đó với một độ tin cậy nhất định.