1. Hồi quy tuyến tính (Linear regression) được sử dụng để làm gì?
A. Mô tả phân phối của một biến số.
B. Đo lường độ phân tán của dữ liệu.
C. Dự đoán giá trị của một biến phụ thuộc dựa trên một hoặc nhiều biến độc lập.
D. Kiểm định sự khác biệt giữa hai nhóm.
2. Nguyên lý thống kê nào cho phép chúng ta suy rộng kết quả từ một mẫu nhỏ lên toàn bộ quần thể?
A. Thống kê mô tả
B. Thống kê suy luận
C. Thống kê ứng dụng
D. Thống kê lý thuyết
3. Trong kiểm định giả thuyết, 'giả thuyết không' thường biểu thị điều gì?
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh là đúng.
B. Giả thuyết ngược lại với điều nhà nghiên cứu muốn chứng minh, thường là không có hiệu ứng hoặc không có sự khác biệt.
C. Giả thuyết luôn luôn đúng.
D. Giả thuyết chỉ đúng với mẫu nhỏ.
4. Giá trị ngoại lệ (Outlier) trong dữ liệu là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất.
C. Giá trị rất khác biệt so với phần lớn dữ liệu còn lại.
D. Giá trị nằm ở giữa dãy dữ liệu.
5. Hệ số tương quan (Correlation coefficient) đo lường điều gì?
A. Giá trị trung bình của hai biến số.
B. Mức độ biến động của hai biến số.
C. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến số.
D. Mức độ khác biệt giữa hai biến số.
6. Độ lệch chuẩn đo lường điều gì?
A. Giá trị trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Hình dạng phân phối của dữ liệu
D. Mối quan hệ giữa hai biến số
7. Sai lầm Loại II trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự sai.
B. Không bác bỏ giả thuyết không khi nó thực sự đúng.
C. Bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không khi nó thực sự sai.
8. Chọn mẫu ngẫu nhiên đơn giản (Simple random sampling) đảm bảo điều gì?
A. Mỗi cá thể trong mẫu có cơ hội được chọn bằng nhau, nhưng không phải mọi cá thể trong quần thể.
B. Mỗi cá thể trong quần thể có cơ hội được chọn bằng nhau vào mẫu.
C. Các cá thể được chọn theo một quy luật nhất định.
D. Chỉ chọn những cá thể dễ tiếp cận nhất.
9. Phương pháp chọn mẫu phân tầng (Stratified sampling) phù hợp khi nào?
A. Khi quần thể đồng nhất.
B. Khi quần thể có các nhóm (tầng) khác biệt và muốn đảm bảo đại diện từ mỗi tầng.
C. Khi không có thông tin về quần thể.
D. Khi cần chọn mẫu nhanh chóng và dễ dàng.
10. Mức ý nghĩa (alpha) thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.5
B. 0.1
C. 0.05
D. 1.0
11. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối tương quan giữa các biến.
12. Thiên lệch chọn mẫu (Sampling bias) là gì?
A. Sai số do đo lường không chính xác.
B. Sai số do tính toán thống kê.
C. Sai số do mẫu không đại diện cho quần thể, dẫn đến kết quả bị lệch lạc.
D. Sai số do kích thước mẫu quá nhỏ.
13. Thang đo tỷ lệ (Ratio scale) là gì?
A. Thang đo có thứ tự và khoảng cách bằng nhau, nhưng không có điểm gốc 0 thực sự.
B. Thang đo chỉ phân loại dữ liệu vào các nhóm không có thứ tự.
C. Thang đo có điểm gốc 0 thực sự và khoảng cách bằng nhau.
D. Thang đo chỉ ra thứ tự nhưng không có khoảng cách bằng nhau.
14. Sai lầm Loại I trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự sai.
B. Không bác bỏ giả thuyết không khi nó thực sự đúng.
C. Bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không bác bỏ giả thuyết không khi nó thực sự sai.
15. Trong thống kê, 'mẫu' được hiểu là gì?
A. Toàn bộ các cá thể hoặc đối tượng được quan tâm nghiên cứu.
B. Một nhóm nhỏ các cá thể hoặc đối tượng được chọn ra từ quần thể để nghiên cứu.
C. Một phương pháp thu thập dữ liệu phổ biến.
D. Một loại biểu đồ thường dùng để trình bày dữ liệu.
16. Định lý giới hạn trung tâm (Central Limit Theorem) nói gì?
A. Trung bình mẫu luôn bằng trung bình quần thể.
B. Phương sai mẫu luôn bằng phương sai quần thể.
C. Phân phối của trung bình mẫu sẽ tiến gần đến phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể phân phối gốc của quần thể.
D. Phân phối của dữ liệu quần thể luôn là phân phối chuẩn.
17. Giá trị mốt (Mode) là gì?
A. Giá trị trung bình cộng của dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất trong dữ liệu.
C. Giá trị nằm ở vị trí chính giữa của dãy dữ liệu đã sắp xếp.
D. Tổng tất cả các giá trị dữ liệu chia cho số lượng giá trị.
18. Phương pháp chọn mẫu cụm (Cluster sampling) thường được sử dụng khi nào?
A. Khi muốn chọn mẫu từ các tầng khác biệt.
B. Khi quần thể phân tán rộng và việc lập danh sách toàn bộ quần thể là khó khăn.
C. Khi cần chọn mẫu ngẫu nhiên đơn giản.
D. Khi muốn đảm bảo đại diện từ mọi tầng.
19. Thang đo thứ bậc (Ordinal scale) là gì?
A. Thang đo có thứ tự và khoảng cách bằng nhau.
B. Thang đo chỉ phân loại dữ liệu vào các nhóm không có thứ tự.
C. Thang đo có điểm gốc 0 thực sự.
D. Thang đo chỉ ra thứ tự nhưng không có khoảng cách bằng nhau.
20. Giá trị trung vị (Median) là gì?
A. Giá trị trung bình cộng của dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất trong dữ liệu.
C. Giá trị nằm ở vị trí chính giữa của dãy dữ liệu đã sắp xếp.
D. Tổng tất cả các giá trị dữ liệu chia cho số lượng giá trị.
21. Tương quan không ngụ ý quan hệ nhân quả. Điều này có nghĩa là gì?
A. Nếu hai biến tương quan với nhau, thì một biến chắc chắn gây ra sự thay đổi ở biến kia.
B. Nếu hai biến tương quan với nhau, thì sự thay đổi ở một biến chỉ có thể là do biến kia.
C. Mối tương quan giữa hai biến không tự động chứng minh rằng một biến gây ra sự thay đổi ở biến kia.
D. Tương quan là một phương pháp mạnh mẽ để chứng minh quan hệ nhân quả.
22. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quảExtreme như (hoặc hơn) kết quả quan sát được, nếu giả thuyết không là đúng.
C. Mức độ quan trọng thực tế của kết quả.
D. Kích thước của hiệu ứng nghiên cứu.
23. Thang đo khoảng (Interval scale) là gì?
A. Thang đo có thứ tự và khoảng cách bằng nhau, nhưng không có điểm gốc 0 thực sự.
B. Thang đo chỉ phân loại dữ liệu vào các nhóm không có thứ tự.
C. Thang đo có điểm gốc 0 thực sự.
D. Thang đo chỉ ra thứ tự nhưng không có khoảng cách bằng nhau.
24. Khoảng tin cậy (Confidence Interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số quần thể.
B. Một khoảng giá trị ước tính chứa tham số quần thể với một độ tin cậy nhất định.
C. Xác suất tham số quần thể nằm trong khoảng ước tính.
D. Độ lệch chuẩn của tham số quần thể.
25. Phương pháp nào sau đây giúp giảm thiểu sai số do chọn mẫu?
A. Tăng kích thước mẫu
B. Giảm kích thước mẫu
C. Sử dụng mẫu phi ngẫu nhiên
D. Chỉ sử dụng thống kê mô tả
26. Thang đo định danh (Nominal scale) là gì?
A. Thang đo có thứ tự và khoảng cách bằng nhau.
B. Thang đo chỉ phân loại dữ liệu vào các nhóm không có thứ tự.
C. Thang đo có điểm gốc 0 thực sự.
D. Thang đo chỉ ra thứ tự nhưng không có khoảng cách bằng nhau.
27. Chọn mẫu thuận tiện (Convenience sampling) có ưu điểm gì?
A. Tính đại diện cao cho quần thể.
B. Giảm thiểu sai số chọn mẫu.
C. Dễ thực hiện và tiết kiệm chi phí.
D. Đảm bảo tính ngẫu nhiên.
28. Phân phối chuẩn (Normal distribution) có đặc điểm gì?
A. Lệch phải.
B. Lệch trái.
C. Đối xứng hình chuông quanh giá trị trung bình.
D. Phân phối đều.
29. Giá trị trung bình cộng của một mẫu được gọi là gì?
A. Tham số
B. Thống kê
C. Biến số
D. Hằng số
30. Phương sai (Variance) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình (bình phương độ lệch chuẩn).
C. Hình dạng phân phối của dữ liệu.
D. Mối quan hệ giữa hai biến số.