1. Trong thống kê kinh doanh, thuật ngữ 'ngoại suy′ (extrapolation) đề cập đến điều gì?
A. Ước tính giá trị bên trong phạm vi dữ liệu đã quan sát
B. Ước tính giá trị bên ngoài phạm vi dữ liệu đã quan sát
C. Loại bỏ giá trị ngoại lai khỏi dữ liệu
D. Chuyển đổi dữ liệu sang dạng chuẩn hóa
2. Phương pháp lấy mẫu ngẫu nhiên đơn giản (Simple random sampling) đảm bảo điều gì?
A. Mỗi phần tử trong tổng thể có cơ hội được chọn vào mẫu như nhau
B. Mẫu phản ánh chính xác cấu trúc của tổng thể
C. Giảm thiểu sai số lấy mẫu
D. Thu thập thông tin nhanh chóng và tiết kiệm chi phí
3. Chỉ số giá tiêu dùng (CPI) đo lường điều gì?
A. Giá cả sản xuất hàng hóa và dịch vụ
B. Mức giá chung của hàng hóa và dịch vụ tiêu dùng bởi hộ gia đình
C. Giá trị xuất khẩu và nhập khẩu
D. Tỷ lệ thất nghiệp
4. Giá trị trung bình của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng các giá trị chia cho số lượng giá trị
B. Giá trị xuất hiện nhiều nhất
C. Tổng của mỗi giá trị nhân với xác suất tương ứng của nó
D. Giá trị ở giữa khi dữ liệu được sắp xếp
5. Biến định tính nào sau đây có thứ tự tự nhiên giữa các phạm trù?
A. Biến danh nghĩa
B. Biến thứ bậc
C. Biến khoảng
D. Biến tỷ lệ
6. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu phân tầng (Stratified sampling) so với lấy mẫu ngẫu nhiên đơn giản là gì?
A. Tiết kiệm chi phí và thời gian hơn
B. Đảm bảo tính đại diện tốt hơn cho các nhóm nhỏ trong tổng thể
C. Dễ thực hiện hơn
D. Loại bỏ hoàn toàn sai số lấy mẫu
7. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) mô tả điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên
B. Sự biến động theo mùa lặp đi lặp lại
C. Sự biến động dài hạn và có hướng của dữ liệu
D. Sự biến động theo chu kỳ kinh tế
8. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Kiểm tra mối quan hệ giữa hai biến định lượng
B. So sánh trung bình của hai nhóm độc lập
C. So sánh trung bình của ba hoặc nhiều hơn nhóm độc lập
D. Đo lường độ phân tán của dữ liệu
9. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) cho trung bình tổng thể?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi độ lệch chuẩn tổng thể đã biết
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn tổng thể chưa biết
D. Khi dữ liệu tuân theo phân phối chuẩn
10. Kiểm định Chi-bình phương (Chi-squared test) thường được sử dụng để làm gì?
A. So sánh trung bình của các nhóm
B. Kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng
C. Kiểm tra tính độc lập giữa hai biến định tính
D. Ước lượng khoảng tin cậy cho trung bình tổng thể
11. Trong phân tích rủi ro, 'giá trị chịu rủi ro′ (Value at Risk - VaR) được sử dụng để đo lường điều gì?
A. Lợi nhuận kỳ vọng tối đa
B. Lỗ tối đa có thể xảy ra trong một khoảng thời gian nhất định với một mức độ tin cậy nhất định
C. Độ lệch chuẩn của lợi nhuận
D. Xác suất đạt được lợi nhuận mục tiêu
12. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc của đường hồi quy thể hiện điều gì?
A. Giá trị trung bình của biến phụ thuộc
B. Mức độ biến thiên của biến phụ thuộc
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
D. Mức độ phù hợp của mô hình hồi quy
13. Phương pháp thống kê nào chủ yếu được sử dụng để tóm tắt và mô tả các đặc điểm chính của một tập dữ liệu?
A. Thống kê suy luận
B. Thống kê mô tả
C. Phân tích hồi quy
D. Kiểm định giả thuyết
14. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của hai biến
B. Mối quan hệ nhân quả giữa hai biến
C. Mức độ và hướng của mối quan hệ tuyến tính giữa hai biến
D. Độ mạnh của mối quan hệ phi tuyến tính giữa hai biến
15. Khi nào thì việc sử dụng trung vị thích hợp hơn trung bình cộng để đo lường xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lai
C. Khi dữ liệu có tính đối xứng
D. Khi dữ liệu rời rạc
16. Khoảng tin cậy (Confidence interval) cung cấp thông tin gì?
A. Giá trị chính xác của tham số tổng thể
B. Ước lượng khoảng cho tham số tổng thể với một mức độ tin cậy nhất định
C. Kiểm định giả thuyết về tham số tổng thể
D. Độ lệch chuẩn của tham số tổng thể
17. Mục đích chính của việc 'chuẩn hóa dữ liệu′ (data normalization) là gì?
A. Loại bỏ giá trị ngoại lai
B. Chuyển đổi dữ liệu về phân phối chuẩn
C. Đưa các biến về cùng thang đo để so sánh và phân tích
D. Giảm kích thước của tập dữ liệu
18. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng
B. Không bác bỏ giả thuyết null khi nó sai
C. Chấp nhận giả thuyết thay thế khi nó sai
D. Bác bỏ giả thuyết thay thế khi nó đúng
19. Mục đích của việc kiểm định tính dừng (stationarity test) trong phân tích chuỗi thời gian là gì?
A. Kiểm tra xem chuỗi thời gian có xu hướng hay không
B. Kiểm tra xem chuỗi thời gian có tính mùa vụ hay không
C. Kiểm tra xem các đặc tính thống kê của chuỗi thời gian (như trung bình và phương sai) có thay đổi theo thời gian hay không
D. Dự báo giá trị tương lai của chuỗi thời gian
20. Trong phân tích dữ liệu lớn (Big Data), thuật ngữ 'khám phá dữ liệu′ (data mining) dùng để chỉ điều gì?
A. Thu thập dữ liệu từ nhiều nguồn khác nhau
B. Làm sạch và chuẩn hóa dữ liệu
C. Tìm kiếm các mẫu, xu hướng và thông tin hữu ích ẩn chứa trong dữ liệu lớn
D. Trực quan hóa dữ liệu bằng biểu đồ và đồ thị
21. Hệ số xác định (R-squared) trong hồi quy bội thể hiện điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
C. Mức độ ý nghĩa thống kê của mô hình hồi quy
D. Sai số chuẩn của mô hình hồi quy
22. Sai số lấy mẫu (Sampling error) là gì?
A. Lỗi do nhập liệu sai
B. Lỗi do chọn mẫu không ngẫu nhiên
C. Sự khác biệt giữa thống kê mẫu và tham số tổng thể do tính ngẫu nhiên của quá trình lấy mẫu
D. Lỗi do thiết kế bảng hỏi không tốt
23. Trong phân tích hồi quy, 'đa cộng tuyến′ (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh giữa biến phụ thuộc và biến độc lập
B. Mối quan hệ tuyến tính mạnh giữa các biến độc lập với nhau
C. Sự vi phạm giả định về phân phối chuẩn của sai số
D. Sự hiện diện của giá trị ngoại lai trong dữ liệu
24. Sai số chuẩn của trung bình mẫu (Standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của tổng thể
B. Độ lệch chuẩn của mẫu
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu
D. Phương sai của mẫu
25. Phân tích hồi quy logistic (Logistic regression) được sử dụng khi nào?
A. Khi biến phụ thuộc là biến định lượng liên tục
B. Khi biến phụ thuộc là biến định tính nhị phân (có∕không, 0∕1)
C. Khi biến độc lập là biến định tính
D. Khi muốn dự báo chuỗi thời gian
26. Thước đo trung tâm nào sau đây ít bị ảnh hưởng nhất bởi giá trị ngoại lai trong một tập dữ liệu?
A. Trung bình cộng (Mean)
B. Trung vị (Median)
C. Trung bình điều hòa (Harmonic Mean)
D. Mốt (Mode)
27. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Mức ý nghĩa thống kê được chọn
C. Xác suất quan sát được kết quả cực đoan như kết quả mẫu (hoặc cực đoan hơn) nếu giả thuyết null là đúng
D. Xác suất mắc sai số loại I
28. Phân phối chuẩn (Normal distribution) có đặc điểm gì?
A. Bị lệch trái
B. Bị lệch phải
C. Đối xứng và hình chuông
D. Đa đỉnh
29. Giá trị hiệp phương sai (Covariance) giữa hai biến cho biết điều gì?
A. Độ mạnh của mối quan hệ tuyến tính chuẩn hóa
B. Hướng của mối quan hệ tuyến tính (dương hoặc âm)
C. Tỷ lệ phương sai chung giữa hai biến
D. Mức độ biến động của từng biến riêng lẻ
30. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Xu hướng trung tâm của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Hình dạng phân phối của dữ liệu
D. Giá trị lớn nhất và nhỏ nhất trong dữ liệu