1. Sai lầm loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Chấp nhận giả thuyết không khi nó thực sự sai.
C. Không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Bác bỏ giả thuyết không khi nó thực sự sai.
2. Độ nhạy (sensitivity) của một xét nghiệm chẩn đoán là gì?
A. Tỷ lệ người bệnh được xét nghiệm xác định chính xác là dương tính.
B. Tỷ lệ người không bệnh được xét nghiệm xác định chính xác là âm tính.
C. Tỷ lệ xét nghiệm dương tính thực sự có bệnh.
D. Tỷ lệ xét nghiệm âm tính thực sự không có bệnh.
3. Ý nghĩa của việc thực hiện phân tích hậu kiểm (post-hoc analysis) sau kiểm định ANOVA là gì?
A. Để xác định xem ANOVA có ý nghĩa thống kê hay không.
B. Để xác định cặp nhóm nào có sự khác biệt đáng kể sau khi ANOVA cho thấy có sự khác biệt tổng thể.
C. Để điều chỉnh giá trị p cho nhiều so sánh.
D. Để tăng kích thước mẫu.
4. Trong thống kê y học, thuật ngữ "người sống sót khỏe mạnh" (healthy survivor effect) đề cập đến điều gì?
A. Những người sống sót sau một căn bệnh nghiêm trọng có sức khỏe tốt hơn so với dân số chung.
B. Những người khỏe mạnh có xu hướng sống lâu hơn.
C. Những người tham gia nghiên cứu thường khỏe mạnh hơn so với những người không tham gia.
D. Những người sống lâu hơn có xu hướng nhớ lại quá khứ một cách chính xác hơn.
5. Trong thống kê y học, giá trị p (p-value) được sử dụng để làm gì?
A. Đánh giá độ lớn của hiệu ứng.
B. Đo lường mức độ tin cậy của kết quả nghiên cứu.
C. Xác định mức ý nghĩa thống kê của kết quả.
D. Tính toán kích thước mẫu cần thiết.
6. Sai lầm loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Chấp nhận giả thuyết không khi nó thực sự sai.
C. Không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Bác bỏ giả thuyết không khi nó thực sự sai.
7. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để đánh giá điều gì?
A. Mối liên hệ giữa hai biến liên tục.
B. Độ chính xác của một xét nghiệm chẩn đoán.
C. Sự phù hợp của một mô hình hồi quy.
D. Sự khác biệt giữa hai nhóm.
8. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach"s alpha được sử dụng để đánh giá điều gì?
A. Độ giá trị (validity) của một công cụ đo lường.
B. Độ tin cậy nội tại (internal consistency) của một thang đo.
C. Độ ổn định theo thời gian (test-retest reliability) của một công cụ đo lường.
D. Độ tin cậy giữa các người đánh giá (inter-rater reliability).
9. Hệ số tương quan (correlation coefficient) có giá trị -1 có ý nghĩa gì?
A. Có mối tương quan dương hoàn hảo giữa hai biến.
B. Có mối tương quan âm hoàn hảo giữa hai biến.
C. Không có mối tương quan tuyến tính giữa hai biến.
D. Có mối tương quan phi tuyến tính giữa hai biến.
10. Độ đặc hiệu (specificity) của một xét nghiệm chẩn đoán là gì?
A. Tỷ lệ người bệnh được xét nghiệm xác định chính xác là dương tính.
B. Tỷ lệ người không bệnh được xét nghiệm xác định chính xác là âm tính.
C. Tỷ lệ xét nghiệm dương tính thực sự có bệnh.
D. Tỷ lệ xét nghiệm âm tính thực sự không có bệnh.
11. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính (Linear Regression).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Kiểm định Chi bình phương (Chi-square test).
12. Khoảng tin cậy (confidence interval) 95% có ý nghĩa gì?
A. Có 95% khả năng giá trị thực của tham số nằm ngoài khoảng này.
B. Có 5% khả năng giá trị thực của tham số nằm trong khoảng này.
C. Nếu lặp lại thí nghiệm nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị thực của tham số.
D. Có 95% khả năng kết quả nghiên cứu là chính xác.
13. Trong phân tích hồi quy logistic, odds ratio (OR) được tính như thế nào?
A. e^(hệ số hồi quy)
B. 1 / e^(hệ số hồi quy)
C. hệ số hồi quy * (1 - hệ số hồi quy)
D. hệ số hồi quy / (1 - hệ số hồi quy)
14. Trong thống kê Bayesian, điều gì được hiểu là "prior probability"?
A. Xác suất của dữ liệu quan sát được.
B. Xác suất ban đầu của một giả thuyết trước khi xem xét dữ liệu.
C. Xác suất của một giả thuyết sau khi xem xét dữ liệu.
D. Xác suất của một sai lầm loại I.
15. Giá trị tiên đoán dương (Positive Predictive Value - PPV) của một xét nghiệm là gì?
A. Xác suất một người có bệnh khi xét nghiệm cho kết quả dương tính.
B. Xác suất một người không có bệnh khi xét nghiệm cho kết quả âm tính.
C. Xác suất xét nghiệm cho kết quả dương tính khi người đó có bệnh.
D. Xác suất xét nghiệm cho kết quả âm tính khi người đó không có bệnh.
16. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc.
D. Sai số của mô hình hồi quy.
17. Công thức nào sau đây được sử dụng để tính khoảng tin cậy cho trung bình mẫu khi độ lệch chuẩn dân số đã biết?
A. $ar{x} pm z_{alpha/2} frac{sigma}{sqrt{n}}$
B. $ar{x} pm t_{alpha/2, n-1} frac{s}{sqrt{n}}$
C. $hat{p} pm z_{alpha/2} sqrt{frac{hat{p}(1-hat{p})}{n}}$
D. $frac{(n_1 - 1)s_1^2}{chi^2_{alpha/2, n_1-1}}$
18. Trong phân tích sống còn, "censoring" đề cập đến điều gì?
A. Việc loại bỏ những người tham gia khỏi nghiên cứu.
B. Việc không biết thời điểm chính xác của một sự kiện cho một số người tham gia.
C. Việc cố ý làm sai lệch dữ liệu.
D. Việc chỉ thu thập dữ liệu từ những người sống sót.
19. Trong một thử nghiệm lâm sàng ngẫu nhiên có đối chứng (randomized controlled trial - RCT), mục đích của việc "làm mù" (blinding) là gì?
A. Để tăng kích thước mẫu.
B. Để đảm bảo rằng các nhóm điều trị là tương đương nhau.
C. Để giảm thiểu thiên vị (bias).
D. Để đơn giản hóa quy trình thu thập dữ liệu.
20. Ý nghĩa của việc điều chỉnh giá trị p (p-value adjustment) trong các so sánh bội (multiple comparisons) là gì?
A. Để tăng khả năng phát hiện ra các hiệu ứng thực sự.
B. Để giảm nguy cơ mắc sai lầm loại I.
C. Để giảm nguy cơ mắc sai lầm loại II.
D. Để tăng kích thước mẫu.
21. Ý nghĩa của tỷ số odds (odds ratio) bằng 1 là gì?
A. Có mối liên hệ mạnh mẽ giữa yếu tố nguy cơ và bệnh.
B. Không có mối liên hệ giữa yếu tố nguy cơ và bệnh.
C. Yếu tố nguy cơ bảo vệ khỏi bệnh.
D. Tỷ lệ mắc bệnh rất cao.
22. Phương pháp nào sau đây phù hợp để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t (t-test).
B. Kiểm định ANOVA.
C. Kiểm định Mann-Whitney U.
D. Kiểm định Chi bình phương (Chi-square).
23. Phương pháp thống kê nào sau đây phù hợp để phân tích dữ liệu bảng (panel data)?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Mô hình tác động cố định (fixed effects model) hoặc mô hình tác động ngẫu nhiên (random effects model).
D. Hồi quy tuyến tính đơn giản.
24. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn (Normal distribution).
B. Phân phối nhị thức (Binomial distribution).
C. Phân phối Poisson (Poisson distribution).
D. Phân phối mũ (Exponential distribution).
25. Trong một nghiên cứu bệnh chứng (case-control study), thước đo nào thường được sử dụng để ước tính mối liên hệ giữa yếu tố nguy cơ và bệnh?
A. Tỷ lệ hiện mắc (prevalence).
B. Tỷ lệ mới mắc (incidence).
C. Tỷ số odds (odds ratio).
D. Nguy cơ tương đối (relative risk).
26. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Đánh giá mối liên hệ giữa hai biến định tính.
C. Dự đoán giá trị của một biến dựa trên biến khác.
D. Đánh giá sự phù hợp của một mô hình thống kê.
27. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) S(t) biểu thị điều gì?
A. Xác suất một cá nhân chết trước thời điểm t.
B. Xác suất một cá nhân sống sót ít nhất đến thời điểm t.
C. Thời gian sống trung bình của một cá nhân.
D. Tỷ lệ tử vong tại thời điểm t.
28. Trong thống kê y học, phương pháp nào thường được sử dụng để đánh giá sự phù hợp của một mô hình lý thuyết với dữ liệu thực tế?
A. Kiểm định t (t-test).
B. Kiểm định Chi bình phương (Chi-square test).
C. Phân tích hồi quy (Regression analysis).
D. Phân tích phương sai (ANOVA).
29. Mục đích của việc chuẩn hóa dữ liệu (data standardization) là gì?
A. Loại bỏ các giá trị ngoại lệ (outliers).
B. Đưa dữ liệu về phân phối chuẩn.
C. Đưa dữ liệu về cùng một thang đo.
D. Tăng kích thước mẫu.
30. Công thức nào sau đây biểu diễn phương sai của một biến ngẫu nhiên X?
A. $E[X^2] - (E[X])^2$
B. $E[X] - (E[X])^2$
C. $E[X^2] + (E[X])^2$
D. $(E[X])^2 - E[X^2]$