1. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị điều gì?
A. Giá trị trung bình của biến phụ thuộc khi biến độc lập bằng 0
B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng lên 1 đơn vị
C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy
D. Mức độ phù hợp của mô hình hồi quy với dữ liệu
2. Khi mức ý nghĩa (alpha) giảm xuống, điều gì xảy ra với khả năng mắc sai số loại II (beta)?
A. Khả năng mắc sai số loại II giảm xuống
B. Khả năng mắc sai số loại II tăng lên
C. Khả năng mắc sai số loại II không đổi
D. Không có mối quan hệ rõ ràng
3. Trong thống kê mô tả, 'mốt' (mode) là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị ở giữa của tập dữ liệu đã sắp xếp
C. Giá trị xuất hiện nhiều lần nhất trong tập dữ liệu
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất
4. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết Null là đúng
B. Xác suất quan sát được dữ liệu cực đoan như dữ liệu mẫu nếu giả thuyết Null là đúng
C. Mức độ quan trọng thực tế của kết quả
D. Ngưỡng ý nghĩa thống kê (alpha)
5. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng trung bình mẫu nằm trong khoảng này
B. Có 95% khả năng trung bình quần thể nằm trong khoảng này
C. Có 95% dữ liệu mẫu nằm trong khoảng này
D. Khoảng này chứa 95% giá trị có thể của tham số
6. Trong hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập
C. Sự phân tán lớn của dữ liệu
D. Cỡ mẫu quá nhỏ
7. Khi cỡ mẫu tăng lên, điều gì thường xảy ra với độ rộng của khoảng tin cậy (confidence interval)?
A. Độ rộng tăng lên
B. Độ rộng giảm xuống
C. Độ rộng không đổi
D. Độ rộng thay đổi ngẫu nhiên
8. Phương pháp lấy mẫu nào mà quần thể được chia thành các nhóm (strata) và sau đó lấy mẫu ngẫu nhiên từ mỗi nhóm?
A. Lấy mẫu ngẫu nhiên đơn giản
B. Lấy mẫu hệ thống
C. Lấy mẫu phân tầng
D. Lấy mẫu cụm
9. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của biến số gây nhiễu (confounding variable) trong nghiên cứu quan sát?
A. Tăng cỡ mẫu
B. Sử dụng phân tích hồi quy đa biến để kiểm soát biến số gây nhiễu
C. Lấy mẫu ngẫu nhiên đơn giản
D. Sử dụng thống kê mô tả
10. Đại lượng thống kê nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Tứ phân vị
11. Nguyên lý nào khẳng định rằng, trong điều kiện nhất định, trung bình của các trung bình mẫu sẽ xấp xỉ bằng trung bình quần thể?
A. Định luật số lớn
B. Định lý giới hạn trung tâm
C. Nguyên tắc Pareto
D. Luật nhân quả
12. Khi nào thì sử dụng kiểm định Chi-bình phương (Chi-squared test)?
A. So sánh trung bình của hai nhóm
B. Đo lường mối quan hệ tuyến tính giữa hai biến liên tục
C. Kiểm tra sự độc lập giữa hai biến định tính
D. Ước lượng tham số quần thể
13. Phương pháp thống kê nào phù hợp để kiểm tra sự khác biệt về trung bình giữa hai nhóm độc lập?
A. Phân tích phương sai (ANOVA)
B. Kiểm định t (t-test) độc lập
C. Tương quan Pearson
D. Kiểm định Chi-bình phương
14. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả và tóm tắt dữ liệu mẫu
B. Thu thập tất cả dữ liệu từ quần thể
C. Đưa ra kết luận về quần thể dựa trên dữ liệu mẫu
D. Trình bày dữ liệu một cách trực quan
15. Trong phân tích phương sai (ANOVA), giả thuyết Null thường là gì?
A. Có sự khác biệt đáng kể giữa trung bình các nhóm
B. Không có sự khác biệt đáng kể giữa trung bình các nhóm
C. Phương sai của các nhóm không bằng nhau
D. Các nhóm không độc lập với nhau
16. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyếtNull khi nó đúng
B. Chấp nhận giả thuyết Null khi nó sai
C. Bác bỏ giả thuyết đối khi nó đúng
D. Chấp nhận giả thuyết đối khi nó sai
17. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ giá trị ngoại lai
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh
C. Tăng kích thước mẫu
D. Thay đổi phân phối dữ liệu thành phân phối chuẩn
18. Ưu điểm chính của việc sử dụng mẫu lớn trong nghiên cứu thống kê là gì?
A. Giảm chi phí và thời gian thu thập dữ liệu
B. Tăng tính đại diện của mẫu và độ chính xác của ước lượng
C. Đơn giản hóa quá trình phân tích dữ liệu
D. Luôn đảm bảo kết quả nghiên cứu là đúng
19. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể
B. Độ lệch chuẩn của mẫu
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu
D. Sai số ngẫu nhiên trong quá trình thu thập dữ liệu
20. Nguyên tắc nào sau đây đảm bảo rằng mỗi cá thể trong quần thể có cơ hội được chọn vào mẫu?
A. Tính đại diện
B. Tính ngẫu nhiên
C. Tính hệ thống
D. Tính tiện lợi
21. Giá trị ngoại lai (outlier) là gì trong thống kê?
A. Giá trị trung bình của dữ liệu
B. Giá trị xuất hiện nhiều nhất
C. Giá trị khác biệt đáng kể so với phần lớn dữ liệu
D. Giá trị nằm ở giữa dữ liệu
22. Trong phân tích dữ liệu định tính, 'mã hóa' (coding) là quá trình gì?
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng
B. Sắp xếp dữ liệu theo thứ tự thời gian
C. Gán nhãn hoặc tên gọi cho các đoạn dữ liệu để xác định chủ đề và mô hình
D. Tính toán các thống kê mô tả cho dữ liệu định tính
23. Loại biểu đồ nào thích hợp nhất để thể hiện phân phối tần số của một biến định lượng liên tục?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ tần suất (Histogram)
D. Biểu đồ hộp (Box plot)
24. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định tính
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Sự khác biệt giữa trung bình của hai nhóm
D. Mức độ phân tán của dữ liệu
25. Phân phối chuẩn (Normal distribution) thường được sử dụng rộng rãi trong thống kê suy diễn vì lý do chính nào?
A. Dễ tính toán các tham số thống kê
B. Mô tả chính xác mọi loại dữ liệu
C. Định lý giới hạn trung tâm (Central Limit Theorem)
D. Luôn có dạng đối xứng hoàn hảo
26. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy
C. Độ chính xác của các hệ số hồi quy
D. Mức độ phù hợp của mô hình với dữ liệu mẫu
27. Loại thang đo nào cho phép sắp xếp thứ tự và xác định khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Định danh (Nominal)
B. Thứ bậc (Ordinal)
C. Khoảng (Interval)
D. Tỷ lệ (Ratio)
28. Khi nào thì kiểm định giả thuyết một phía (one-tailed test) phù hợp hơn kiểm định hai phía (two-tailed test)?
A. Khi không có giả thuyết cụ thể về hướng của sự khác biệt
B. Khi chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn)
C. Khi cỡ mẫu nhỏ
D. Khi muốn tăng khả năng mắc sai số loại II
29. Khi nào thì trung vị (median) là thước đo trung tâm tốt hơn so với trung bình (mean)?
A. Khi dữ liệu phân phối chuẩn
B. Khi dữ liệu bị lệch (skewed) hoặc có giá trị ngoại lai
C. Khi cỡ mẫu lớn
D. Khi cần tính toán nhanh chóng
30. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu
B. Mức độ phân tán trung bình của dữ liệu xung quanh trung bình
C. Giá trị lớn nhất trong dữ liệu
D. Giá trị nhỏ nhất trong dữ liệu