Đề 14 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Phương pháp phân tích 'Predictive Analytics′ (Phân tích dự đoán) được ứng dụng để làm gì trong kinh doanh?
A. Mô tả dữ liệu quá khứ.
B. Dự báo xu hướng và kết quả trong tương lai.
C. Thống kê dữ liệu hiện tại.
D. Trực quan hóa dữ liệu hiện tại.
2. Trong lĩnh vực Nhân sự (HR), Khoa học dữ liệu có thể giúp ích gì?
A. Tăng tỷ lệ nghỉ việc của nhân viên.
B. Giảm hiệu quả tuyển dụng.
C. Dự đoán tỷ lệ nghỉ việc và tối ưu hóa quy trình tuyển dụng.
D. Làm giảm sự hài lòng của nhân viên.
3. Phương pháp 'Clustering′ (Phân cụm) trong Khoa học dữ liệu thường được sử dụng để làm gì?
A. Dự đoán giá trị của một biến số liên tục.
B. Phân loại dữ liệu vào các nhóm định trước.
C. Nhóm các điểm dữ liệu tương tự nhau thành các cụm.
D. Đánh giá mức độ quan trọng của các biến số.
4. Trong lĩnh vực Marketing, Khoa học dữ liệu có thể được ứng dụng để:
A. Tăng chi phí quảng cáo và giảm hiệu quả tiếp cận khách hàng.
B. Phân khúc khách hàng và cá nhân hóa trải nghiệm.
C. Giảm khả năng đo lường hiệu quả chiến dịch Marketing.
D. Loại bỏ sự tương tác giữa doanh nghiệp và khách hàng.
5. Trong ngữ cảnh kinh doanh trực tuyến (E-commerce), Khoa học dữ liệu có thể giúp cải thiện trải nghiệm khách hàng bằng cách nào?
A. Hiển thị quảng cáo không liên quan đến sở thích của khách hàng.
B. Gửi thông báo spam thường xuyên.
C. Đề xuất sản phẩm cá nhân hóa và cải thiện hệ thống tìm kiếm.
D. Làm chậm tốc độ tải trang web.
6. Đâu là một thách thức về đạo đức khi sử dụng Khoa học dữ liệu trong kinh doanh?
A. Tăng cường bảo mật dữ liệu cá nhân.
B. Đảm bảo tính minh bạch và giải thích được của mô hình.
C. Nguy cơ xâm phạm quyền riêng tư và phân biệt đối xử do thiên vị trong dữ liệu.
D. Tăng cường trách nhiệm giải trình của doanh nghiệp.
7. Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) trong kinh doanh?
A. Dữ liệu giao dịch bán hàng trong cơ sở dữ liệu.
B. Bảng thống kê chi phí.
C. Bài đăng trên mạng xã hội và đánh giá sản phẩm trực tuyến.
D. Dữ liệu nhân khẩu học khách hàng.
8. Quy trình 'Data Mining′ (Khai thác dữ liệu) trong Khoa học dữ liệu chủ yếu tập trung vào giai đoạn nào?
A. Thu thập dữ liệu.
B. Làm sạch và tiền xử lý dữ liệu.
C. Phân tích và khám phá mẫu ẩn trong dữ liệu.
D. Trực quan hóa dữ liệu.
9. Đâu là lợi ích chính của việc sử dụng 'Data Visualization′ (Trực quan hóa dữ liệu) trong kinh doanh?
A. Tăng độ phức tạp của dữ liệu.
B. Giảm khả năng hiểu dữ liệu.
C. Giúp nhận diện xu hướng và thông tin chi tiết dễ dàng hơn.
D. Hạn chế số lượng dữ liệu có thể phân tích.
10. Đâu là phát biểu đúng nhất về vai trò của Khoa học dữ liệu trong kinh tế và kinh doanh?
A. Giảm thiểu sự phụ thuộc vào quyết định dựa trên trực giác.
B. Tăng cường chi phí hoạt động của doanh nghiệp.
C. Loại bỏ hoàn toàn vai trò của con người trong quá trình ra quyết định.
D. Hạn chế khả năng mở rộng thị trường của doanh nghiệp.
11. Chỉ số 'Precision′ (Độ chính xác) trong đánh giá mô hình phân loại đo lường điều gì?
A. Tỷ lệ dự đoán đúng trên tổng số mẫu thực tế là tích cực.
B. Tỷ lệ dự đoán đúng là tích cực trên tổng số mẫu được dự đoán là tích cực.
C. Tỷ lệ dự đoán sai là tích cực trên tổng số mẫu thực tế là tích cực.
D. Tỷ lệ dự đoán sai là tiêu cực trên tổng số mẫu được dự đoán là tiêu cực.
12. Đâu là công cụ lập trình phổ biến nhất được sử dụng trong Khoa học dữ liệu?
A. Java.
B. C++.
C. Python.
D. Swift.
13. Phương pháp 'Dimensionality Reduction′ (Giảm chiều dữ liệu) được sử dụng để làm gì?
A. Tăng số lượng biến số trong dữ liệu.
B. Giảm số lượng biến số trong dữ liệu mà vẫn giữ được thông tin quan trọng.
C. Tăng độ phức tạp của mô hình.
D. Trực quan hóa dữ liệu nhiều chiều một cách trực tiếp.
14. Ứng dụng nào sau đây KHÔNG phải là ứng dụng của Khoa học dữ liệu trong kinh doanh?
A. Dự báo doanh số bán hàng.
B. Tối ưu hóa giá sản phẩm.
C. Thiết kế logo và bộ nhận diện thương hiệu.
D. Phân tích rủi ro tín dụng.
15. Trong ngữ cảnh kinh tế, 'Time Series Analysis′ (Phân tích chuỗi thời gian) được sử dụng để làm gì?
A. Phân tích dữ liệu không có yếu tố thời gian.
B. Dự đoán giá trị của biến số tại một thời điểm cố định.
C. Phân tích và dự báo các xu hướng và mô hình theo thời gian.
D. Phân loại dữ liệu thành các nhóm khác nhau.
16. Khi đánh giá hiệu suất của mô hình phân loại (classification model), chỉ số 'Accuracy′ (Độ chính xác) có thể gây hiểu lầm trong trường hợp nào?
A. Khi dữ liệu được cân bằng giữa các lớp.
B. Khi kích thước dữ liệu rất lớn.
C. Khi dữ liệu bị mất mát nhiều.
D. Khi dữ liệu không cân bằng giữa các lớp (imbalanced dataset).
17. Đâu là một ví dụ về 'Supervised Learning′ (Học có giám sát) trong Khoa học dữ liệu?
A. Phân cụm khách hàng dựa trên hành vi mua sắm.
B. Dự đoán giá nhà dựa trên các đặc điểm của ngôi nhà (diện tích, vị trí…).
C. Giảm chiều dữ liệu bằng PCA.
D. Tìm kiếm các giao dịch mua hàng thường đi kèm nhau.
18. Trong Khoa học dữ liệu, 'Bias′ (Thiên vị) trong dữ liệu huấn luyện có thể dẫn đến hậu quả gì?
A. Mô hình hoạt động tốt hơn trên mọi loại dữ liệu.
B. Mô hình đưa ra dự đoán không công bằng hoặc phân biệt đối xử.
C. Mô hình trở nên dễ giải thích hơn.
D. Mô hình hoạt động nhanh hơn.
19. Phương pháp 'Regression′ (Hồi quy) trong Khoa học dữ liệu được sử dụng để làm gì?
A. Phân loại dữ liệu vào các nhóm rời rạc.
B. Dự đoán một giá trị số liên tục.
C. Nhóm các điểm dữ liệu tương tự nhau.
D. Giảm số chiều dữ liệu.
20. Trong bối cảnh kinh doanh, 'Big Data′ (Dữ liệu lớn) thường được mô tả bởi đặc điểm nào sau đây?
A. Dữ liệu có kích thước nhỏ và cấu trúc đơn giản.
B. Dữ liệu được tạo ra với tốc độ chậm.
C. Dữ liệu có khối lượng lớn, tốc độ tạo sinh nhanh và đa dạng về loại hình.
D. Dữ liệu chỉ bao gồm văn bản và số.
21. Trong các kỹ thuật sau, kỹ thuật nào KHÔNG thuộc về 'Machine Learning′ (Học máy)?
A. Hồi quy tuyến tính (Linear Regression).
B. Phân tích phương sai (ANOVA).
C. Mạng nơ-ron (Neural Networks).
D. Cây quyết định (Decision Trees).
22. Trong quá trình xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (test set) nhằm mục đích gì?
A. Tăng kích thước dữ liệu huấn luyện.
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới.
C. Làm cho quá trình huấn luyện nhanh hơn.
D. Trực quan hóa dữ liệu dễ dàng hơn.
23. Trong lĩnh vực Marketing số (Digital Marketing), chỉ số 'Click-Through Rate′ (CTR) được sử dụng để đo lường điều gì?
A. Tổng chi phí cho chiến dịch quảng cáo.
B. Tỷ lệ người dùng nhấp vào quảng cáo so với số lần quảng cáo được hiển thị.
C. Số lượng chuyển đổi từ quảng cáo.
D. Thời gian trung bình người dùng xem quảng cáo.
24. Trong mô hình cây quyết định (Decision Tree), 'Gini Impurity′ được sử dụng để làm gì?
A. Đo lường độ chính xác của mô hình.
B. Đo lường mức độ 'hỗn loạn′ của một tập hợp các nhãn lớp.
C. Đo lường độ phức tạp của cây.
D. Đo lường độ sâu của cây.
25. Mục tiêu chính của 'Feature Engineering′ (Kỹ thuật đặc trưng) trong Khoa học dữ liệu là gì?
A. Thu thập dữ liệu thô.
B. Chọn và biến đổi dữ liệu thô thành các đặc trưng phù hợp để mô hình học máy hoạt động tốt hơn.
C. Xây dựng mô hình học máy phức tạp.
D. Trực quan hóa dữ liệu đầu ra.
26. Phương pháp 'A∕B testing′ (Thử nghiệm A∕B) thường được sử dụng để làm gì trong kinh doanh dựa trên dữ liệu?
A. Dự báo doanh số bán hàng trong tương lai.
B. So sánh hiệu quả của hai phiên bản khác nhau của một yếu tố (ví dụ: trang web, quảng cáo).
C. Phân tích dữ liệu lịch sử.
D. Xây dựng mô hình học máy phức tạp.
27. Trong tài chính, Khoa học dữ liệu được sử dụng để phát hiện gian lận (fraud detection) bằng cách nào?
A. Ngẫu nhiên chọn giao dịch để kiểm tra.
B. Phân tích hành vi giao dịch bất thường và mô hình gian lận.
C. Chỉ dựa vào báo cáo từ khách hàng.
D. Loại bỏ hoàn toàn giao dịch trực tuyến.
28. Đâu là thách thức lớn nhất khi triển khai các dự án Khoa học dữ liệu trong doanh nghiệp?
A. Sự dư thừa nguồn nhân lực có kỹ năng.
B. Dễ dàng truy cập dữ liệu chất lượng cao.
C. Thiếu hụt nhân tài có chuyên môn và kỹ năng phù hợp.
D. Chi phí phần mềm và hạ tầng thấp.
29. Đâu là ví dụ về ứng dụng của Khoa học dữ liệu trong quản lý chuỗi cung ứng?
A. Tăng thời gian giao hàng và tồn kho.
B. Dự báo nhu cầu và tối ưu hóa tồn kho.
C. Giảm khả năng theo dõi hàng hóa trong chuỗi cung ứng.
D. Làm gián đoạn quá trình vận hành.
30. Khái niệm 'Overfitting′ (Quá khớp) trong học máy xảy ra khi nào?
A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình học quá kém trên dữ liệu huấn luyện.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.