1. Phương pháp lấy mẫu nào mà mỗi phần tử của tổng thể đều có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu phân tầng
B. Lấy mẫu cụm
C. Lấy mẫu thuận tiện
D. Lấy mẫu ngẫu nhiên đơn giản
2. Sai số chuẩn của ước lượng (standard error of estimate) trong hồi quy tuyến tính đo lường điều gì?
A. Độ lệch chuẩn của các hệ số hồi quy
B. Độ lệch chuẩn của biến độc lập
C. Độ lệch chuẩn của các phần dư (residuals)
D. Độ lệch chuẩn của biến phụ thuộc
3. Phương pháp lấy mẫu nào chia tổng thể thành các nhóm đồng nhất (strata) trước khi chọn mẫu ngẫu nhiên từ mỗi nhóm?
A. Lấy mẫu cụm
B. Lấy mẫu ngẫu nhiên đơn giản
C. Lấy mẫu hệ thống
D. Lấy mẫu phân tầng
4. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi giả định về phân phối của dữ liệu không được đáp ứng
D. Khi cần tính toán khoảng tin cậy
5. Phương pháp thống kê nào thường được sử dụng để giảm chiều dữ liệu (dimensionality reduction) trong học máy?
A. Phân tích phương sai (ANOVA)
B. Phân tích hồi quy tuyến tính (Linear Regression)
C. Phân tích thành phần chính (PCA)
D. Kiểm định Chi bình phương (Chi-squared test)
6. Trong phân tích thời gian (time series analysis), thành phần nào thể hiện sự biến động dài hạn và xu hướng chung của dữ liệu?
A. Tính mùa vụ (Seasonality)
B. Tính chu kỳ (Cyclicality)
C. Xu hướng (Trend)
D. Tính ngẫu nhiên (Irregularity)
7. Trong kiểm định giả thuyết, lỗi loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Chấp nhận giả thuyết null khi nó thực sự sai
C. Bác bỏ giả thuyết đối khi nó thực sự đúng
D. Chấp nhận giả thuyết đối khi nó thực sự sai
8. Đại lượng nào sau đây đo lường sự bất đối xứng của phân phối dữ liệu?
A. Phương sai
B. Độ nhọn
C. Độ lệch
D. Khoảng tứ phân vị
9. Biểu đồ hộp (boxplot) thường không thể hiện thông tin nào sau đây?
A. Trung vị
B. Khoảng tứ phân vị
C. Giá trị ngoại lai
D. Mốt
10. Biến định tính (qualitative variable) còn được gọi là biến gì?
A. Biến liên tục
B. Biến định lượng
C. Biến rời rạc
D. Biến phân loại
11. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ phi tuyến giữa các biến
B. Tương quan cao giữa các biến độc lập
C. Phương sai của sai số thay đổi
D. Thiếu biến quan trọng trong mô hình
12. Phân phối nào thường được sử dụng để mô hình hóa số lần xuất hiện của một sự kiện trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối nhị thức
B. Phân phối Poisson
C. Phân phối chuẩn
D. Phân phối đều
13. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc phi tuyến tính giữa hai biến
B. Mức độ biến thiên của một biến
C. Mức độ quan hệ tuyến tính giữa hai biến
D. Độ mạnh của xu hướng trung tâm
14. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Khoảng tứ phân vị
15. Độ lệch chuẩn của trung bình mẫu (standard error of the mean) giảm khi nào?
A. Kích thước mẫu giảm
B. Độ lệch chuẩn tổng thể tăng
C. Kích thước mẫu tăng
D. Giá trị trung bình mẫu tăng
16. Trong phân tích ANOVA, mục đích chính là gì?
A. Kiểm tra mối quan hệ giữa hai biến định lượng
B. So sánh trung bình của hai nhóm
C. So sánh trung bình của ba nhóm trở lên
D. Đo lường độ phân tán của dữ liệu
17. Trong thống kê suy diễn, việc tăng kích thước mẫu thường dẫn đến điều gì?
A. Tăng sai số chuẩn
B. Giảm độ chính xác của ước lượng
C. Giảm sai số chuẩn
D. Tăng độ lệch của ước lượng
18. Loại lỗi nào trong kiểm định giả thuyết có thể giảm bằng cách tăng kích thước mẫu?
A. Lỗi loại I (α)
B. Lỗi loại II (β)
C. Cả lỗi loại I và loại II
D. Không lỗi nào trong hai loại trên
19. Loại biểu đồ nào phù hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau trong một tổng thể?
A. Biểu đồ đường
B. Biểu đồ cột
C. Biểu đồ tròn
D. Biểu đồ tán xạ
20. Giá trị P (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Mức ý nghĩa của kiểm định
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng
D. Kích thước hiệu ứng của kiểm định
21. Giá trị nào sau đây KHÔNG bị ảnh hưởng bởi giá trị ngoại lai (outlier) trong một tập dữ liệu?
A. Trung bình
B. Độ lệch chuẩn
C. Trung vị
D. Khoảng biến thiên
22. Đại lượng nào sau đây là thước đo vị trí trung tâm KHÔNG phù hợp khi dữ liệu có phân phối lệch?
A. Trung vị
B. Mốt
C. Trung bình
D. Khoảng tứ phân vị
23. Trong phân tích hồi quy tuyến tính đơn giản, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy
B. Giá trị trung bình của biến độc lập
C. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0
D. Mức độ phù hợp của mô hình
24. Trong thống kê mô tả, 'tần suất tương đối′ (relative frequency) được tính như thế nào?
A. Tổng số quan sát chia cho số lần xuất hiện của giá trị
B. Số lần xuất hiện của giá trị chia cho tổng số quan sát
C. Số lần xuất hiện của giá trị nhân với tổng số quan sát
D. Tổng số quan sát trừ đi số lần xuất hiện của giá trị
25. Trong thống kê Bayes, khái niệm 'prior probability′ (xác suất tiên nghiệm) đề cập đến điều gì?
A. Xác suất của dữ liệu quan sát được
B. Xác suất của tham số trước khi có dữ liệu
C. Xác suất của tham số sau khi có dữ liệu
D. Xác suất của giả thuyết null
26. Trong kiểm định Chi bình phương về tính độc lập, giả thuyết null (H0) thường là gì?
A. Các biến có liên quan đến nhau
B. Các biến không có liên quan đến nhau
C. Trung bình của các biến bằng nhau
D. Phương sai của các biến khác nhau
27. Phương pháp nào sau đây được sử dụng để kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không?
A. Kiểm định t-Student
B. Kiểm định Chi bình phương
C. Kiểm định Kolmogorov-Smirnov
D. Phân tích phương sai (ANOVA)
28. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) S(t) biểu thị điều gì?
A. Xác suất sự kiện xảy ra tại thời điểm t
B. Xác suất sự kiện xảy ra trước thời điểm t
C. Xác suất sự kiện không xảy ra trước thời điểm t (sống sót đến thời điểm t)
D. Tốc độ xảy ra sự kiện tại thời điểm t
29. Phương pháp nào sau đây thường được sử dụng để ước lượng khoảng tin cậy cho trung bình tổng thể khi độ lệch chuẩn tổng thể chưa biết và kích thước mẫu nhỏ?
A. Phân phối Z
B. Phân phối chuẩn
C. Phân phối t-Student
D. Phân phối Chi bình phương
30. Trong phân tích phương sai hai yếu tố (two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc và tương tác giữa chúng
C. Mối quan hệ tuyến tính giữa hai biến
D. Sự khác biệt giữa hai trung bình mẫu