1. Khi nào thì trung vị (median) là thước đo xu hướng trung tâm tốt hơn so với trung bình (mean)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lai (outliers).
C. Khi muốn tính tổng các giá trị.
D. Khi kích thước mẫu rất lớn.
2. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
B. Có 95% khả năng trung bình quần thể nằm trong khoảng này.
C. Khoảng này chứa 95% dữ liệu mẫu.
D. Sai số chuẩn của ước lượng trung bình là 5%.
3. Trong phân tích dữ liệu khảo sát, tỷ lệ phản hồi thấp có thể dẫn đến loại sai lệch nào?
A. Sai lệch chọn mẫu (Sampling bias).
B. Sai lệch không phản hồi (Non-response bias).
C. Sai lệch đo lường (Measurement bias).
D. Sai lệch người quan sát (Observer bias).
4. Loại lỗi nào thường gặp khi sử dụng dữ liệu thứ cấp trong nghiên cứu kinh doanh?
A. Lỗi do thiết kế khảo sát không tốt.
B. Lỗi không phản hồi từ người tham gia.
C. Lỗi do dữ liệu không phù hợp với mục tiêu nghiên cứu hiện tại.
D. Lỗi do chọn mẫu không ngẫu nhiên.
5. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend component) thể hiện điều gì?
A. Biến động ngắn hạn và ngẫu nhiên.
B. Mô hình biến động có tính chu kỳ trong ngắn hạn.
C. Sự biến động theo mùa trong năm.
D. Sự thay đổi dài hạn và có hệ thống của dữ liệu.
6. Hồi quy Logistic được sử dụng chủ yếu cho loại biến phụ thuộc nào?
A. Biến định lượng liên tục.
B. Biến định tính thứ bậc.
C. Biến định tính nhị phân (Binary∕Dummy).
D. Biến đếm (Count data).
7. Độ lệch chuẩn đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Hình dạng phân phối của dữ liệu.
D. Giá trị lớn nhất và nhỏ nhất trong dữ liệu.
8. Phương pháp phân tích thành phần chính (Principal Component Analysis - PCA) được sử dụng để làm gì?
A. Dự báo chuỗi thời gian.
B. Phân loại dữ liệu.
C. Giảm chiều dữ liệu và tìm ra các thành phần quan trọng nhất.
D. Kiểm định giả thuyết về trung bình quần thể.
9. Phương pháp lấy mẫu phân tầng (stratified sampling) thường được sử dụng khi nào?
A. Khi muốn tiết kiệm chi phí và thời gian thu thập dữ liệu.
B. Khi quần thể nghiên cứu đồng nhất.
C. Khi quần thể nghiên cứu có thể chia thành các nhóm (strata) khác nhau và muốn đảm bảo đại diện từ mỗi nhóm.
D. Khi không có danh sách đầy đủ các đơn vị trong quần thể.
10. Phân phối Poisson thường được sử dụng để mô hình hóa sự kiện nào?
A. Thời gian hoàn thành một dự án.
B. Số lượng khách hàng đến cửa hàng trong một khoảng thời gian nhất định.
C. Chiều cao trung bình của nhân viên trong công ty.
D. Lợi nhuận hàng năm của một doanh nghiệp.
11. Kiểm định Chi bình phương (Chi-squared test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. Kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát.
C. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
D. Dự báo giá trị của biến phụ thuộc.
12. Trong phân tích phương sai (ANOVA), giả thuyết null thường là gì?
A. Có sự khác biệt đáng kể giữa trung bình của tất cả các nhóm.
B. Phương sai của tất cả các nhóm là bằng nhau.
C. Không có sự khác biệt đáng kể giữa trung bình của tất cả các nhóm.
D. Dữ liệu tuân theo phân phối chuẩn.
13. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Xác định xu hướng dài hạn.
B. Loại bỏ thành phần mùa vụ.
C. Làm mịn chuỗi thời gian và giảm nhiễu.
D. Dự báo giá trị tương lai dựa trên mô hình ARMA.
14. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Mức độ phân tán của các trung bình mẫu xung quanh trung bình quần thể.
C. Sai số ngẫu nhiên trong mỗi quan sát.
D. Khoảng tin cậy của trung bình quần thể.
15. Phương pháp lấy mẫu nào đảm bảo mỗi đơn vị trong quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phân tầng (Stratified sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu cụm (Cluster sampling).
16. Giá trị P (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Ngưỡng ý nghĩa thống kê được chọn trước.
C. Xác suất quan sát được kết quả thống kê (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Độ mạnh của bằng chứng ủng hộ giả thuyết đối.
17. Loại biểu đồ nào thích hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ đường (Line chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ hộp (Box plot).
D. Biểu đồ phân tán (Scatter plot).
18. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) gây ra vấn đề gì?
A. Mô hình trở nên không tuyến tính.
B. Các hệ số hồi quy trở nên không đáng tin cậy và khó diễn giải.
C. Sai số chuẩn của các hệ số giảm đáng kể.
D. Khả năng dự báo của mô hình tăng lên.
19. Trong phân tích rủi ro, độ lệch chuẩn của lợi nhuận đầu tư thường được sử dụng để đo lường điều gì?
A. Lợi nhuận kỳ vọng.
B. Rủi ro (tính biến động) của đầu tư.
C. Giá trị hiện tại ròng (NPV).
D. Tỷ suất sinh lời nội bộ (IRR).
20. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn mẫu không đại diện cho quần thể.
D. Sử dụng kiểm định thống kê không phù hợp.
21. Phương pháp nào thường được sử dụng để kiểm định sự khác biệt giữa trung bình của hai quần thể độc lập?
A. Phân tích phương sai (ANOVA).
B. Kiểm định t (t-test) cho hai mẫu độc lập.
C. Kiểm định Chi bình phương (Chi-squared test).
D. Hồi quy đa biến (Multiple regression).
22. Phương pháp nào được sử dụng để phân tích mối quan hệ giữa một biến định lượng và một hoặc nhiều biến định tính?
A. Hồi quy tuyến tính đơn giản.
B. Phân tích phương sai (ANOVA).
C. Hồi quy logistic.
D. Phân tích tương quan.
23. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi các giả định của kiểm định tham số không được thỏa mãn.
D. Khi muốn tính toán khoảng tin cậy.
24. Thống kê mô tả tập trung chủ yếu vào điều gì trong kinh tế và kinh doanh?
A. Dự báo xu hướng thị trường trong tương lai.
B. Thu thập và phân tích dữ liệu sơ cấp.
C. Tóm tắt và mô tả các đặc điểm chính của dữ liệu.
D. Đưa ra quyết định dựa trên suy luận thống kê.
25. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) thể hiện điều gì?
A. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
B. Mức độ biến thiên của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
C. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
D. Sai số chuẩn của các hệ số hồi quy.
26. Hệ số tương quan Pearson đo lường điều gì giữa hai biến định lượng?
A. Mối quan hệ nhân quả.
B. Mức độ phụ thuộc tuyến tính.
C. Sự khác biệt về phương sai.
D. Giá trị trung bình của hai biến.
27. Hệ số xác định R-squared trong hồi quy tuyến tính đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Sai số chuẩn của mô hình.
D. Ý nghĩa thống kê của các hệ số hồi quy.
28. Phương pháp nào thường được sử dụng để dự báo doanh số bán hàng trong tương lai dựa trên dữ liệu doanh số lịch sử?
A. Phân tích tương quan.
B. Phân tích hồi quy tuyến tính.
C. Phân tích chuỗi thời gian.
D. Phân tích phương sai (ANOVA).
29. Trong kiểm định giả thuyết, việc tăng kích thước mẫu thường có tác động gì đến khả năng bác bỏ giả thuyết null (nếu nó sai)?
A. Giảm khả năng bác bỏ giả thuyết null.
B. Không ảnh hưởng đến khả năng bác bỏ giả thuyết null.
C. Tăng khả năng bác bỏ giả thuyết null.
D. Làm tăng sai số loại II.
30. Loại thang đo nào cho phép xác định thứ tự và khoảng cách bằng nhau giữa các giá trị, nhưng không có điểm gốc 0 tuyệt đối?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).