1. Định lý giới hạn trung tâm (Central Limit Theorem) nói rằng:
A. Phân phối của dữ liệu mẫu luôn là phân phối chuẩn.
B. Trung bình mẫu luôn bằng trung bình tổng thể.
C. Phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể phân phối gốc.
D. Phương sai mẫu luôn bằng phương sai tổng thể.
2. Giá trị của hệ số tương quan Pearson (Pearson correlation coefficient) luôn nằm trong khoảng:
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -1 đến 1.
D. Từ 0 đến vô cùng.
3. Giá trị trung vị (Median) là độ đo vị trí trung tâm KHÔNG bị ảnh hưởng bởi:
A. Sắp xếp thứ tự các giá trị.
B. Giá trị của các quan sát ở giữa dãy số liệu.
C. Giá trị của tất cả các quan sát trong mẫu.
D. Các giá trị ngoại lệ (outliers) trong mẫu.
4. Chọn mẫu phân tầng (Stratified Sampling) phù hợp khi:
A. Tổng thể đồng nhất.
B. Tổng thể có các nhóm (tầng) khác biệt rõ rệt.
C. Không cần đảm bảo tính đại diện của mẫu.
D. Muốn chọn mẫu nhanh chóng và dễ dàng.
5. Thống kê học mô tả và phân tích dữ liệu định lượng, nhưng KHÔNG tập trung vào việc:
A. Thu thập dữ liệu một cách hệ thống.
B. Trình bày dữ liệu một cách trực quan.
C. Rút ra kết luận từ dữ liệu mẫu về tổng thể.
D. Đưa ra đánh giá chủ quan về ý nghĩa của dữ liệu.
6. Trong phân tích phương sai (ANOVA), mục tiêu chính là:
A. Đo lường mối tương quan giữa các biến số.
B. So sánh phương sai của hai mẫu.
C. So sánh trung bình của nhiều nhóm.
D. Phân tích sự biến động của một biến số duy nhất.
7. Phương sai (Variance) là bình phương của độ lệch chuẩn và được sử dụng để:
A. Đơn giản hóa việc tính toán độ lệch chuẩn.
B. Loại bỏ giá trị âm của độ lệch chuẩn.
C. Đo lường tổng độ biến động của dữ liệu.
D. Chuẩn hóa dữ liệu về thang đo chung.
8. Khoảng tin cậy (Confidence Interval) 95% cho trung bình tổng thể có nghĩa là:
A. 95% mẫu có trung bình nằm trong khoảng này.
B. Có 95% khả năng trung bình tổng thể nằm trong khoảng này.
C. Khoảng này chứa 95% dữ liệu của mẫu.
D. Nếu lặp lại lấy mẫu 100 lần, khoảng 95 lần khoảng tin cậy này sẽ chứa trung bình mẫu.
9. Trong kiểm định giả thuyết (Hypothesis Testing), giả thuyết không (Null Hypothesis) thường biểu thị:
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh.
B. Giả thuyết ngược lại với điều nhà nghiên cứu mong đợi.
C. Giả thuyết về sự không có hiệu ứng hoặc không có sự khác biệt.
D. Giả thuyết được chấp nhận nếu p-value nhỏ.
10. Thang đo thứ bậc (Ordinal scale) khác với thang đo định danh ở chỗ:
A. Có thể đo khoảng cách giữa các giá trị.
B. Có điểm gốc 0 tuyệt đối.
C. Các nhóm có thể được sắp xếp theo thứ tự.
D. Không có sự khác biệt.
11. Phân phối chuẩn (Normal Distribution) có đặc điểm:
A. Lệch trái.
B. Lệch phải.
C. Đối xứng hình chuông.
D. Đa đỉnh.
12. Thang đo khoảng (Interval scale) có đặc điểm:
A. Không có thứ tự.
B. Không có khoảng cách bằng nhau giữa các giá trị.
C. Có khoảng cách bằng nhau giữa các giá trị nhưng không có điểm gốc 0 tuyệt đối.
D. Có điểm gốc 0 tuyệt đối.
13. Chọn mẫu ngẫu nhiên đơn giản (Simple Random Sampling) đảm bảo rằng:
A. Mẫu luôn đại diện hoàn hảo cho tổng thể.
B. Mỗi phần tử trong tổng thể có cơ hội được chọn vào mẫu như nhau.
C. Các phần tử được chọn vào mẫu có đặc điểm giống nhau.
D. Mẫu luôn có kích thước lớn.
14. Biến định lượng (Quantitative variable) mô tả:
A. Các đặc điểm thuộc tính hoặc phân loại.
B. Các đặc điểm không thể đo lường bằng số.
C. Các đặc điểm số lượng, có thể đo đếm hoặc đo lường.
D. Thứ tự ưu tiên của các đặc điểm.
15. Phân tích thống kê mô tả (Descriptive Statistics) chủ yếu được sử dụng để:
A. Dự đoán giá trị tương lai của biến số.
B. Ước lượng tham số của tổng thể dựa trên mẫu.
C. Tóm tắt và trình bày các đặc trưng chính của tập dữ liệu.
D. Kiểm định các giả thuyết về mối quan hệ giữa các biến số.
16. Thiên vị chọn mẫu (Selection bias) xảy ra khi:
A. Mẫu quá nhỏ.
B. Phương pháp chọn mẫu không đảm bảo tính ngẫu nhiên và đại diện.
C. Có sai số lấy mẫu lớn.
D. Không có đủ thông tin về tổng thể.
17. Sai số lấy mẫu (Sampling error) là:
A. Lỗi do tính toán sai.
B. Lỗi do thiết kế nghiên cứu kém.
C. Sự khác biệt tự nhiên giữa mẫu và tổng thể do tính ngẫu nhiên.
D. Lỗi do đo lường không chính xác.
18. Hồi quy tuyến tính (Linear Regression) được sử dụng để:
A. Phân loại dữ liệu thành các nhóm.
B. Tìm mối quan hệ phi tuyến tính giữa các biến.
C. Mô hình hóa mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập.
D. Đo lường độ phân tán của dữ liệu.
19. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện:
A. Xác suất giả thuyết không là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quảExtreme như (hoặc hơn) kết quả mẫu, nếu giả thuyết không đúng.
D. Mức độ ý nghĩa thực tế của kết quả.
20. Thang đo tỷ lệ (Ratio scale) là thang đo cao nhất vì nó:
A. Không có thứ tự.
B. Không có khoảng cách bằng nhau giữa các giá trị.
C. Không có điểm gốc 0 tuyệt đối.
D. Có điểm gốc 0 tuyệt đối và khoảng cách bằng nhau giữa các giá trị.
21. Độ lệch chuẩn (Standard Deviation) đo lường:
A. Vị trí trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất.
22. Hệ số tương quan (Correlation coefficient) đo lường:
A. Mức độ biến động của một biến số.
B. Mức độ phụ thuộc nhân quả giữa hai biến số.
C. Mức độ và chiều hướng của mối quan hệ tuyến tính giữa hai biến số.
D. Sự khác biệt giữa giá trị trung bình của hai biến số.
23. Biến định tính (Qualitative variable) mô tả:
A. Các đặc điểm số lượng.
B. Các đặc điểm thuộc tính hoặc phân loại.
C. Mức độ mạnh yếu của một đặc điểm.
D. Thứ tự ưu tiên của các đặc điểm.
24. Mức ý nghĩa (Significance level, alpha) thường được chọn là 0.05, có nghĩa là:
A. Có 5% khả năng giả thuyết không là đúng.
B. Có 5% khả năng mắc lỗi loại II.
C. Chúng ta sẵn sàng chấp nhận 5% rủi ro bác bỏ giả thuyết không khi nó thực sự đúng (lỗi loại I).
D. Kết quả có ý nghĩa thống kê 95%.
25. Chọn mẫu cụm (Cluster Sampling) thường được sử dụng khi:
A. Muốn chọn mẫu ngẫu nhiên đơn giản.
B. Tổng thể được chia thành các cụm tự nhiên (ví dụ: lớp học, khu phố).
C. Muốn phân tầng tổng thể theo nhiều tiêu chí.
D. Cần độ chính xác cao nhất và chi phí thấp nhất.
26. Trong thống kê suy luận (Inferential Statistics), mục tiêu chính là:
A. Tính toán các độ đo trung tâm và phân tán của mẫu.
B. Mô tả chi tiết từng giá trị trong tập dữ liệu.
C. Tổng quát hóa kết quả từ mẫu lên toàn bộ tổng thể.
D. Phân loại dữ liệu thành các nhóm khác nhau.
27. Lỗi loại II (Type II error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết không khi nó thực sự sai.
B. Không bác bỏ giả thuyết không khi nó thực sự đúng.
C. Bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không khi nó thực sự sai.
28. Giá trị trung bình (Mean) của một mẫu dữ liệu bị ảnh hưởng nhiều nhất bởi:
A. Số lượng quan sát trong mẫu.
B. Giá trị lớn nhất và nhỏ nhất trong mẫu.
C. Các giá trị ngoại lệ (outliers) trong mẫu.
D. Vị trí trung tâm của dữ liệu.
29. Lỗi loại I (Type I error) trong kiểm định giả thuyết xảy ra khi:
A. Bác bỏ giả thuyết không khi nó thực sự sai.
B. Không bác bỏ giả thuyết không khi nó thực sự đúng.
C. Bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không khi nó thực sự sai.
30. Thang đo định danh (Nominal scale) được sử dụng cho dữ liệu:
A. Có thứ tự tự nhiên.
B. Đo khoảng cách bằng nhau giữa các giá trị.
C. Phân loại các đối tượng vào các nhóm không có thứ tự.
D. Có điểm gốc 0 tuyệt đối.