Đề 11 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Kỹ thuật 'xử lý ngôn ngữ tự nhiên′ (NLP) được sử dụng để phân tích loại dữ liệu nào?
A. Dữ liệu số.
B. Dữ liệu hình ảnh.
C. Dữ liệu văn bản.
D. Dữ liệu âm thanh.
2. Trong quản lý chuỗi cung ứng, Khoa học dữ liệu có thể giúp:
A. Tăng độ phức tạp của chuỗi cung ứng.
B. Dự đoán nhu cầu và tối ưu hóa tồn kho.
C. Làm chậm quá trình vận chuyển hàng hóa.
D. Giảm khả năng theo dõi hàng hóa.
3. Đâu là lợi ích của việc sử dụng Khoa học dữ liệu trong quản lý rủi ro?
A. Tăng rủi ro kinh doanh.
B. Đánh giá rủi ro nhanh chóng và chính xác hơn, đưa ra quyết định ứng phó kịp thời.
C. Bỏ qua các biện pháp phòng ngừa rủi ro.
D. Làm cho rủi ro trở nên không thể dự đoán.
4. Phương pháp nào sau đây giúp giảm chiều dữ liệu (dimensionality reduction) trong Khoa học dữ liệu?
A. Phân tích phương sai (ANOVA).
B. Phân tích thành phần chính (PCA).
C. Phân tích hồi quy tuyến tính.
D. Phân tích tương quan.
5. Đâu là ví dụ về dữ liệu 'phi cấu trúc′ (unstructured data) trong kinh doanh?
A. Bảng dữ liệu doanh số bán hàng.
B. Cơ sở dữ liệu khách hàng.
C. Bài đánh giá sản phẩm trực tuyến.
D. Báo cáo tài chính.
6. Mô hình 'cây quyết định′ (decision tree) hoạt động dựa trên nguyên tắc:
A. Phân tích dữ liệu thành các cụm.
B. Dự đoán giá trị số dựa trên hồi quy.
C. Chia dữ liệu thành các nhánh dựa trên các quy tắc quyết định.
D. Tìm kiếm các luật kết hợp trong dữ liệu.
7. Khái niệm 'Big Data′ (Dữ liệu lớn) thường được mô tả bằng các đặc điểm nào (V′s)?
A. Volume, Velocity, Variety, Veracity, Value.
B. Visibility, Validity, Velocity, Volume, Versatility.
C. Volatility, Velocity, Variety, Volume, Verification.
D. Virtue, Velocity, Variety, Volume, Victory.
8. Trong phân tích rủi ro tín dụng, Khoa học dữ liệu giúp ngân hàng:
A. Tăng lãi suất cho vay.
B. Đánh giá khả năng trả nợ của khách hàng và giảm thiểu rủi ro nợ xấu.
C. Cho vay nhiều hơn mà không cần đánh giá rủi ro.
D. Từ chối mọi yêu cầu vay vốn.
9. Trong kinh tế và kinh doanh, Khoa học dữ liệu chủ yếu được sử dụng để:
A. Tăng cường bảo mật dữ liệu cá nhân.
B. Dự báo xu hướng thị trường và hành vi khách hàng.
C. Tự động hóa hoàn toàn quy trình sản xuất.
D. Thay thế các quyết định quản lý bằng thuật toán.
10. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực tài chính?
A. Phát hiện gian lận giao dịch thẻ tín dụng.
B. Dự báo giá cổ phiếu.
C. Tối ưu hóa quy trình sản xuất nông nghiệp.
D. Đánh giá rủi ro tín dụng.
11. Mục tiêu chính của việc 'làm sạch dữ liệu′ (data cleaning) trong Khoa học dữ liệu là gì?
A. Tăng dung lượng lưu trữ dữ liệu.
B. Cải thiện chất lượng dữ liệu bằng cách xử lý dữ liệu thiếu, nhiễu và không nhất quán.
C. Mã hóa dữ liệu để bảo mật thông tin.
D. Tăng tốc độ truy xuất dữ liệu.
12. Trong lĩnh vực bán lẻ, Khoa học dữ liệu có thể hỗ trợ quyết định về:
A. Thiết kế logo cửa hàng.
B. Giá cả, vị trí đặt sản phẩm và chương trình khuyến mãi.
C. Lựa chọn màu sơn tường cho cửa hàng.
D. Tuyển dụng nhân viên bán hàng.
13. Trong Khoa học dữ liệu, 'overfitting′ (quá khớp) xảy ra khi:
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình không học được mẫu từ dữ liệu huấn luyện.
C. Mô hình quá đơn giản để nắm bắt được sự phức tạp của dữ liệu.
D. Mô hình chạy quá chậm do dữ liệu lớn.
14. Trong kinh doanh trực tuyến, Khoa học dữ liệu có thể giúp cá nhân hóa trải nghiệm khách hàng bằng cách:
A. Giảm giá thành sản phẩm.
B. Hiển thị quảng cáo ngẫu nhiên cho mọi khách hàng.
C. Đề xuất sản phẩm phù hợp dựa trên lịch sử mua sắm và hành vi duyệt web.
D. Tăng tần suất gửi email quảng cáo.
15. Chỉ số nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại trong Khoa học dữ liệu?
A. RMSE (Root Mean Squared Error).
B. R-squared.
C. Accuracy (Độ chính xác).
D. MAE (Mean Absolute Error).
16. Trong lĩnh vực marketing, Khoa học dữ liệu giúp tối ưu hóa chiến dịch quảng cáo bằng cách:
A. Tăng chi phí quảng cáo.
B. Nhắm mục tiêu quảng cáo đến đúng đối tượng khách hàng tiềm năng.
C. Sử dụng quảng cáo đại trà cho tất cả mọi người.
D. Loại bỏ hoàn toàn quảng cáo.
17. Trong kinh tế vĩ mô, Khoa học dữ liệu có thể hỗ trợ phân tích và dự báo:
A. Vi hành vi của từng cá nhân.
B. Tổng sản phẩm quốc nội (GDP) và tỷ lệ lạm phát.
C. Quyết định mua hàng của một hộ gia đình.
D. Chi phí sản xuất của một doanh nghiệp nhỏ.
18. Mô hình 'hộp đen′ (black box model) trong học máy thường được nhắc đến khi:
A. Mô hình có cấu trúc đơn giản và dễ hiểu.
B. Mô hình có khả năng giải thích rõ ràng logic đưa ra quyết định.
C. Mô hình phức tạp, khó giải thích cách thức đưa ra dự đoán.
D. Mô hình luôn cho kết quả chính xác tuyệt đối.
19. Trong phân tích chuỗi thời gian, mô hình ARIMA thường được sử dụng để:
A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự báo các giá trị tương lai dựa trên dữ liệu quá khứ theo thời gian.
C. Tìm mối quan hệ nhân quả giữa các biến.
D. Giảm chiều dữ liệu chuỗi thời gian.
20. Công cụ lập trình nào phổ biến nhất trong Khoa học dữ liệu?
A. Java.
B. C++.
C. Python.
D. Swift.
21. Trong lĩnh vực nhân sự (HR), Khoa học dữ liệu có thể được dùng để:
A. Giảm lương nhân viên.
B. Dự đoán tỷ lệ nghỉ việc của nhân viên và cải thiện quy trình tuyển dụng.
C. Tăng cường giám sát nhân viên.
D. Thay thế hoàn toàn bộ phận nhân sự bằng máy móc.
22. Trong Khoa học dữ liệu, thuật ngữ 'feature selection′ (lựa chọn đặc trưng) nghĩa là:
A. Tạo ra các đặc trưng mới từ dữ liệu.
B. Chọn ra một tập hợp con các đặc trưng quan trọng nhất để sử dụng trong mô hình.
C. Biến đổi dữ liệu số thành dữ liệu văn bản.
D. Chia dữ liệu thành các phần huấn luyện và kiểm thử.
23. Trong Khoa học dữ liệu, 'bias′ (thiên vị) trong dữ liệu huấn luyện có thể dẫn đến:
A. Mô hình hoạt động tốt hơn trên mọi loại dữ liệu.
B. Mô hình đưa ra dự đoán không công bằng hoặc phân biệt đối xử.
C. Mô hình học nhanh hơn và hiệu quả hơn.
D. Mô hình trở nên dễ giải thích hơn.
24. Trong mô hình học máy, 'feature engineering′ (kỹ thuật tạo đặc trưng) đề cập đến:
A. Quá trình chọn thuật toán học máy phù hợp nhất.
B. Quá trình chuẩn bị và biến đổi dữ liệu đầu vào để cải thiện hiệu suất mô hình.
C. Quá trình đánh giá hiệu suất của mô hình.
D. Quá trình triển khai mô hình vào thực tế.
25. Thuật ngữ 'dashboard′ (bảng điều khiển) trong Khoa học dữ liệu thường được dùng để chỉ:
A. Một loại thuật toán học máy đặc biệt.
B. Một giao diện trực quan hóa dữ liệu, tổng hợp thông tin quan trọng.
C. Một phương pháp làm sạch dữ liệu.
D. Một công cụ để quản lý dự án Khoa học dữ liệu.
26. Đâu là thách thức chính khi áp dụng Khoa học dữ liệu vào kinh doanh?
A. Chi phí phần mềm phân tích dữ liệu quá thấp.
B. Thiếu hụt nhân sự có kỹ năng Khoa học dữ liệu.
C. Dữ liệu kinh doanh luôn có cấu trúc hoàn hảo.
D. Các thuật toán Khoa học dữ liệu quá dễ hiểu và triển khai.
27. Phương pháp học máy nào thuộc loại 'học có giám sát′ (supervised learning)?
A. Phân cụm K-Means.
B. Phân tích thành phần chính (PCA).
C. Cây quyết định (Decision Tree).
D. Luật kết hợp (Association Rule Mining).
28. Đâu là rủi ro đạo đức tiềm ẩn khi sử dụng Khoa học dữ liệu trong kinh doanh?
A. Tăng cường sự minh bạch trong quyết định kinh doanh.
B. Sử dụng dữ liệu cá nhân một cách xâm phạm quyền riêng tư.
C. Giảm thiểu sự thiên vị trong thuật toán.
D. Đảm bảo công bằng trong việc ra quyết định.
29. Kỹ thuật nào của Khoa học dữ liệu thường được dùng để phân nhóm khách hàng dựa trên hành vi mua sắm?
A. Phân tích hồi quy.
B. Phân tích chuỗi thời gian.
C. Phân cụm (Clustering).
D. Kiểm định giả thuyết.
30. Trong Khoa học dữ liệu, 'model deployment′ (triển khai mô hình) là giai đoạn:
A. Huấn luyện mô hình trên dữ liệu.
B. Đánh giá hiệu suất mô hình.
C. Tích hợp mô hình đã huấn luyện vào hệ thống thực tế để sử dụng.
D. Làm sạch dữ liệu đầu vào.