1. Phương pháp trực quan hóa dữ liệu nào phù hợp nhất để so sánh phân phối của một biến số giữa các nhóm khác nhau?
A. Biểu đồ đường
B. Biểu đồ hộp (boxplot)
C. Biểu đồ tròn
D. Biểu đồ tần số
2. Khi nào hệ số tương quan Pearson bằng 0?
A. Khi có mối quan hệ tuyến tính mạnh giữa hai biến
B. Khi không có mối quan hệ tuyến tính giữa hai biến
C. Khi có mối quan hệ phi tuyến tính giữa hai biến
D. Khi một trong hai biến là biến định tính
3. Khi nào việc sử dụng cỡ mẫu lớn trở nên đặc biệt quan trọng trong thống kê ứng dụng?
A. Khi tổng thể đồng nhất
B. Khi muốn tăng độ chính xác của ước lượng
C. Khi chi phí thu thập dữ liệu thấp
D. Khi sử dụng thống kê mô tả
4. Phân tích phương sai (ANOVA) thường được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến định lượng
B. So sánh trung bình của ba nhóm trở lên
C. Phân loại đối tượng vào các nhóm
D. Ước lượng xác suất của một sự kiện
5. Trong phân tích dữ liệu lớn (Big Data), thống kê ứng dụng đóng vai trò gì?
A. Thay thế hoàn toàn các phương pháp thống kê truyền thống
B. Cung cấp nền tảng phương pháp luận để xử lý và phân tích dữ liệu
C. Giảm tầm quan trọng của việc thu thập dữ liệu chất lượng
D. Chỉ tập trung vào mô tả dữ liệu, không cần suy diễn
6. Trong thống kê ứng dụng, loại biến số nào thường được sử dụng để phân loại đối tượng vào các nhóm khác nhau?
A. Biến định lượng
B. Biến định tính
C. Biến liên tục
D. Biến rời rạc
7. Trong phân tích hồi quy, hệ số hồi quy cho biết điều gì?
A. Mức độ phân tán của dữ liệu
B. Mức độ phù hợp của mô hình
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
D. Mức độ tương quan giữa các biến độc lập
8. Lợi ích chính của việc sử dụng phần mềm thống kê trong thống kê ứng dụng là gì?
A. Giảm sự cần thiết phải hiểu các nguyên tắc thống kê
B. Tăng tốc độ và độ chính xác của phân tích dữ liệu
C. Loại bỏ hoàn toàn sai sót trong phân tích
D. Thay thế vai trò của nhà thống kê
9. Trong kiểm định giả thuyết, mức ý nghĩa α (alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc sai số loại II là 5%
B. Xác suất chấp nhận giả thuyết không đúng là 5%
C. Xác suất bác bỏ giả thuyết không đúng khi nó thực sự đúng là 5%
D. Xác suất bác bỏ giả thuyết không đúng khi nó thực sự sai là 5%
10. Phương pháp thống kê nào sau đây thường được sử dụng để ước lượng giá trị trung bình của một tổng thể dựa trên dữ liệu mẫu?
A. Thống kê mô tả
B. Thống kê suy diễn
C. Phân tích hồi quy
D. Kiểm định giả thuyết
11. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của các yếu tố nhiễu trong nghiên cứu quan sát?
A. Thử nghiệm ngẫu nhiên có đối chứng
B. Phân tích hồi quy đa biến
C. Thống kê mô tả
D. Kiểm định t-test
12. Ứng dụng nào sau đây KHÔNG phải là ứng dụng của thống kê ứng dụng?
A. Dự báo doanh số bán hàng
B. Chẩn đoán bệnh dựa trên triệu chứng
C. Chứng minh định lý toán học
D. Đánh giá chất lượng sản phẩm
13. Phương pháp thống kê nào phù hợp để kiểm tra xem có mối liên hệ giữa giới tính và mức độ hài lòng với công việc hay không?
A. Phân tích hồi quy tuyến tính
B. Kiểm định Chi-square
C. Kiểm định t-test độc lập
D. Phân tích phương sai (ANOVA)
14. Trong phân tích chuỗi thời gian, mục đích chính của việc phân tích thành phần xu hướng là gì?
A. Xác định biến động ngắn hạn
B. Loại bỏ yếu tố mùa vụ
C. Xác định biến động dài hạn
D. Dự báo giá trị tương lai gần
15. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi cỡ mẫu lớn
B. Khi dữ liệu tuân theo phân phối chuẩn
C. Khi giả định về phân phối của dữ liệu không được đáp ứng
D. Khi muốn ước lượng tham số tổng thể
16. Trong thống kê ứng dụng, 'dân số' (population) đề cập đến điều gì?
A. Tập hợp con của các đối tượng được chọn để nghiên cứu
B. Toàn bộ tập hợp các đối tượng mà nhà nghiên cứu quan tâm
C. Số lượng người trong một quốc gia
D. Các biến số được đo lường trong nghiên cứu
17. Thống kê ứng dụng chủ yếu tập trung vào giai đoạn nào của quá trình nghiên cứu khoa học?
A. Thiết kế nghiên cứu
B. Thu thập dữ liệu
C. Phân tích và diễn giải dữ liệu
D. Báo cáo kết quả
18. Loại sai số nào thường gặp khi thu thập dữ liệu bằng phương pháp phỏng vấn?
A. Sai số do chọn mẫu
B. Sai số do người trả lời
C. Sai số do xử lý dữ liệu
D. Sai số do công cụ đo lường
19. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không đúng là đúng
B. Xác suất dữ liệu quan sát được xảy ra nếu giả thuyết không đúng là đúng
C. Xác suất giả thuyết không đúng là sai
D. Xác suất dữ liệu quan sát được là do sai sót đo lường
20. Độ lệch chuẩn đo lường điều gì về một tập dữ liệu?
A. Giá trị trung tâm của dữ liệu
B. Sự phân tán của dữ liệu xung quanh giá trị trung bình
C. Hình dạng phân phối của dữ liệu
D. Mức độ bất đối xứng của dữ liệu
21. Khi nào việc sử dụng thống kê mô tả là phù hợp nhất trong một nghiên cứu?
A. Khi muốn khái quát đặc điểm của dữ liệu hiện có
B. Khi muốn dự đoán xu hướng tương lai
C. Khi muốn kiểm định mối quan hệ nhân quả
D. Khi muốn so sánh giữa các nhóm tổng thể
22. Sai số loại I trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng
B. Chấp nhận giả thuyết không sai
C. Bác bỏ giả thuyết không đúng trong khi nó thực sự đúng
D. Chấp nhận giả thuyết không sai trong khi nó thực sự sai
23. Trong nghiên cứu khoa học, thống kê ứng dụng giúp làm gì để tăng tính khách quan?
A. Thay thế hoàn toàn ý kiến chủ quan của nhà nghiên cứu
B. Cung cấp bằng chứng dựa trên dữ liệu để hỗ trợ hoặc bác bỏ giả thuyết
C. Đơn giản hóa quá trình nghiên cứu
D. Giảm thiểu chi phí nghiên cứu
24. Ứng dụng thống kê ứng dụng trong y học thường tập trung vào điều gì?
A. Phát triển thuốc mới
B. Đánh giá hiệu quả điều trị và dự phòng bệnh
C. Nghiên cứu cấu trúc tế bào
D. Phân tích DNA
25. Ứng dụng nào sau đây thể hiện rõ nhất vai trò của thống kê ứng dụng trong lĩnh vực kinh doanh?
A. Xây dựng mô hình lý thuyết kinh tế
B. Phân tích hiệu quả chiến dịch marketing
C. Nghiên cứu lịch sử phát triển kinh tế
D. Dự báo xu hướng chính trị
26. Hạn chế chính của việc chỉ sử dụng thống kê mô tả là gì?
A. Khó thực hiện trên máy tính
B. Không thể đưa ra kết luận về tổng thể
C. Yêu cầu cỡ mẫu quá lớn
D. Chỉ áp dụng cho biến định lượng
27. Chọn phát biểu SAI về thống kê ứng dụng:
A. Thống kê ứng dụng là một nhánh của toán học thuần túy.
B. Thống kê ứng dụng sử dụng các phương pháp thống kê để giải quyết vấn đề thực tế.
C. Thống kê ứng dụng có vai trò quan trọng trong nhiều lĩnh vực khoa học và kinh tế.
D. Thống kê ứng dụng dựa trên dữ liệu để đưa ra kết luận.
28. Chọn phát biểu đúng về phương pháp lấy mẫu ngẫu nhiên đơn giản:
A. Mỗi phần tử trong tổng thể có cơ hội được chọn khác nhau
B. Chỉ áp dụng cho tổng thể nhỏ
C. Mỗi phần tử trong tổng thể có cơ hội được chọn như nhau
D. Cần chia tổng thể thành các nhóm trước khi lấy mẫu
29. Khi dữ liệu bị lệch (skewed), thước đo xu hướng trung tâm nào thường được ưu tiên sử dụng hơn so với trung bình?
A. Trung vị (median)
B. Trung bình (mean)
C. Mốt (mode)
D. Độ lệch chuẩn
30. Trong thống kê ứng dụng, khái niệm 'ngoại lệ' (outlier) đề cập đến điều gì?
A. Dữ liệu phổ biến nhất trong tập dữ liệu
B. Dữ liệu nằm gần giá trị trung bình
C. Dữ liệu có giá trị khác biệt đáng kể so với phần lớn dữ liệu còn lại
D. Dữ liệu được thu thập từ nguồn bên ngoài