Đề 1 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Đâu là ví dụ về dữ liệu 'phi cấu trúc′ thường được sử dụng trong khoa học dữ liệu kinh doanh?
A. Bảng dữ liệu doanh số bán hàng.
B. Cơ sở dữ liệu khách hàng quan hệ.
C. Đánh giá sản phẩm trực tuyến dạng văn bản.
D. Báo cáo tài chính định kỳ.
2. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khoa học dữ liệu trong kinh doanh?
A. Dự báo doanh số bán hàng.
B. Tối ưu hóa chuỗi cung ứng.
C. Thiết kế logo và bộ nhận diện thương hiệu.
D. Phân tích rủi ro tín dụng.
3. Phương pháp khoa học dữ liệu nào giúp doanh nghiệp phân khúc khách hàng dựa trên hành vi mua sắm?
A. Hồi quy tuyến tính.
B. Phân tích tương quan.
C. Phân cụm (Clustering).
D. Kiểm định giả thuyết.
4. Quy trình 'CRISP-DM′ trong khoa học dữ liệu bắt đầu bằng giai đoạn nào?
A. Triển khai (Deployment).
B. Hiểu dữ liệu (Data Understanding).
C. Hiểu bài toán kinh doanh (Business Understanding).
D. Đánh giá (Evaluation).
5. Trong khoa học dữ liệu, 'overfitting′ (quá khớp) có nghĩa là gì?
A. Mô hình hoạt động quá chậm.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.
C. Mô hình không đủ dữ liệu để học.
D. Mô hình quá đơn giản và không nắm bắt được các mẫu phức tạp.
6. Công cụ hoặc ngôn ngữ lập trình nào sau đây KHÔNG thường được sử dụng trong khoa học dữ liệu?
A. Python.
B. R.
C. Java.
D. SQL.
7. Trong khoa học dữ liệu, 'feature scaling′ (tỷ lệ đặc trưng) là quá trình làm gì?
A. Chọn ra các đặc trưng quan trọng nhất.
B. Chuẩn hóa hoặc co giãn giá trị các đặc trưng về một phạm vi nhất định để tránh ảnh hưởng của thang đo.
C. Tạo ra các đặc trưng mới từ các đặc trưng hiện có.
D. Loại bỏ các đặc trưng không liên quan.
8. Đâu là vai trò chính của khoa học dữ liệu trong việc ra quyết định kinh doanh hiện đại?
A. Tăng cường trực giác của nhà quản lý.
B. Cung cấp thông tin dựa trên dữ liệu để hỗ trợ và cải thiện quyết định.
C. Thay thế hoàn toàn vai trò của con người trong quá trình ra quyết định.
D. Giảm sự phụ thuộc vào dữ liệu lịch sử.
9. Chỉ số 'accuracy′ (độ chính xác) thường được sử dụng để đánh giá hiệu suất của mô hình phân loại trong khoa học dữ liệu, nhưng có nhược điểm gì khi dữ liệu bị mất cân bằng (imbalanced data)?
A. Accuracy không còn phù hợp và có thể gây hiểu lầm về hiệu suất thực tế của mô hình.
B. Accuracy trở nên quá cao và khó đạt được.
C. Accuracy chỉ đo lường đúng các trường hợp dự đoán đúng là lớp đa số.
D. Accuracy không thể tính toán được trên dữ liệu mất cân bằng.
10. Trong lĩnh vực bán lẻ, khoa học dữ liệu có thể giúp tối ưu hóa giá sản phẩm như thế nào?
A. Giảm giá tất cả các sản phẩm để tăng doanh số.
B. Phân tích dữ liệu thị trường và đối thủ cạnh tranh để định giá động, tối đa hóa lợi nhuận.
C. Tăng giá sản phẩm để tăng lợi nhuận.
D. Giữ giá sản phẩm ổn định trong thời gian dài.
11. Kỹ thuật khoa học dữ liệu nào thường được dùng để phân tích cảm xúc khách hàng từ dữ liệu văn bản (ví dụ: đánh giá sản phẩm)?
A. Phân tích hồi quy.
B. Xử lý ngôn ngữ tự nhiên (NLP) và phân tích tình cảm.
C. Phân tích chuỗi thời gian.
D. Phân tích phương sai.
12. Trong lĩnh vực kinh doanh trực tuyến (E-commerce), khoa học dữ liệu có thể giúp cải thiện hệ thống đề xuất sản phẩm (recommendation system) như thế nào?
A. Tăng số lượng sản phẩm hiển thị trên trang chủ.
B. Phân tích hành vi khách hàng để đề xuất sản phẩm phù hợp và cá nhân hóa.
C. Giảm giá sản phẩm được đề xuất.
D. Thay đổi màu sắc và giao diện của trang web.
13. Trong khoa học dữ liệu, 'regularization′ (chính quy hóa) là kỹ thuật để giải quyết vấn đề gì?
A. Dữ liệu bị thiếu.
B. Overfitting (quá khớp).
C. Dữ liệu nhiễu.
D. Tốc độ huấn luyện chậm.
14. Mục tiêu của việc 'feature engineering′ (kỹ thuật đặc trưng) trong khoa học dữ liệu là gì?
A. Giảm kích thước dữ liệu.
B. Cải thiện hiệu suất và độ chính xác của mô hình học máy bằng cách tạo ra các đặc trưng phù hợp.
C. Làm sạch và chuẩn hóa dữ liệu.
D. Chọn thuật toán học máy phù hợp nhất.
15. Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào giúp giữ lại phương sai lớn nhất trong dữ liệu gốc?
A. Phân tích thành phần chính (PCA).
B. Phân tích thành phần độc lập (ICA).
C. Phân tích biệt số tuyến tính (LDA).
D. Phân tích đa tạp (Manifold Learning).
16. Trong khoa học dữ liệu, 'gradient descent′ (gradient xuống) là thuật toán được sử dụng để làm gì?
A. Chọn đặc trưng quan trọng nhất.
B. Tối ưu hóa tham số của mô hình học máy bằng cách tìm cực tiểu của hàm mất mát.
C. Giảm chiều dữ liệu.
D. Phân cụm dữ liệu.
17. Trong phân tích chuỗi thời gian, phương pháp 'ARIMA′ được sử dụng để làm gì?
A. Phân cụm dữ liệu chuỗi thời gian.
B. Dự báo giá trị tương lai dựa trên các giá trị quá khứ và sai số dự báo.
C. Phân tích thành phần chính của chuỗi thời gian.
D. Phân tích mối quan hệ giữa các chuỗi thời gian khác nhau.
18. Trong marketing, khoa học dữ liệu có thể giúp tối ưu hóa chiến dịch quảng cáo bằng cách nào?
A. Tự động tạo nội dung quảng cáo.
B. Phân tích hiệu quả quảng cáo và nhắm mục tiêu quảng cáo đến đối tượng phù hợp.
C. Giảm chi phí thiết kế quảng cáo.
D. Thay thế hoàn toàn nhân viên marketing.
19. Đâu là một thách thức về mặt đạo đức khi sử dụng dữ liệu cá nhân trong khoa học dữ liệu kinh doanh?
A. Chi phí lưu trữ dữ liệu lớn.
B. Xâm phạm quyền riêng tư và sử dụng dữ liệu sai mục đích.
C. Khó khăn trong việc thu thập dữ liệu.
D. Dữ liệu có thể bị lỗi thời nhanh chóng.
20. Thách thức lớn nhất khi áp dụng khoa học dữ liệu vào kinh doanh là gì?
A. Chi phí phần mềm khoa học dữ liệu quá cao.
B. Thiếu nhân lực có kỹ năng phù hợp và khả năng tích hợp dữ liệu từ nhiều nguồn.
C. Sự phản đối từ các bộ phận kinh doanh truyền thống.
D. Khó khăn trong việc chứng minh giá trị của khoa học dữ liệu cho lãnh đạo.
21. Trong lĩnh vực tài chính, khoa học dữ liệu được sử dụng để phát hiện gian lận bằng cách nào?
A. Tăng cường bảo mật hệ thống giao dịch.
B. Phân tích các mẫu giao dịch bất thường và hành vi đáng ngờ.
C. Giảm thiểu số lượng giao dịch thủ công.
D. Tối ưu hóa tốc độ xử lý giao dịch.
22. Trong kinh tế học, mô hình khoa học dữ liệu nào thường được sử dụng để dự báo nhu cầu thị trường?
A. Phân tích thành phần chính (PCA).
B. Mạng nơ-ron hồi quy (RNN).
C. Phân cụm K-Means.
D. Phân tích ANOVA.
23. Đâu là một ví dụ về ứng dụng của khoa học dữ liệu trong quản lý chuỗi cung ứng?
A. Dự báo thời tiết để lên kế hoạch vận chuyển.
B. Tối ưu hóa mức tồn kho và dự báo nhu cầu để giảm chi phí.
C. Thiết kế bao bì sản phẩm hấp dẫn hơn.
D. Tự động hóa quy trình thanh toán cho nhà cung cấp.
24. Phương pháp 'ensemble learning′ (học tập kết hợp) trong khoa học dữ liệu nhằm mục đích gì?
A. Giảm kích thước dữ liệu huấn luyện.
B. Cải thiện độ chính xác và độ ổn định của mô hình bằng cách kết hợp dự đoán từ nhiều mô hình khác nhau.
C. Tăng tốc độ huấn luyện mô hình.
D. Làm sạch dữ liệu đầu vào.
25. Thuật ngữ 'data mining′ (khai phá dữ liệu) thường được sử dụng để chỉ công đoạn nào trong quy trình khoa học dữ liệu?
A. Thu thập và làm sạch dữ liệu.
B. Phân tích dữ liệu để khám phá ra các mẫu và tri thức ẩn.
C. Trực quan hóa dữ liệu.
D. Triển khai mô hình vào thực tế.
26. Phương pháp 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?
A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khách quan hiệu suất của mô hình trên dữ liệu chưa từng thấy và tránh overfitting.
C. Làm sạch dữ liệu huấn luyện.
D. Chọn thuật toán học máy tốt nhất.
27. Đâu là lợi ích chính của việc sử dụng khoa học dữ liệu để cá nhân hóa trải nghiệm khách hàng?
A. Giảm chi phí hoạt động.
B. Tăng cường lòng trung thành và sự hài lòng của khách hàng.
C. Đơn giản hóa quy trình quản lý khách hàng.
D. Tăng cường khả năng bảo mật thông tin khách hàng.
28. Trong ngữ cảnh khoa học dữ liệu và đạo đức, vấn đề 'bias′ (thiên vị) trong dữ liệu huấn luyện có thể dẫn đến hậu quả gì?
A. Mô hình hoạt động kém hiệu quả hơn.
B. Mô hình đưa ra quyết định không công bằng hoặc phân biệt đối xử.
C. Tăng chi phí tính toán mô hình.
D. Khó khăn trong việc giải thích kết quả mô hình.
29. Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong quản lý nhân sự (HR)?
A. Thiết kế văn phòng làm việc.
B. Dự đoán tỷ lệ nghỉ việc của nhân viên và tìm hiểu yếu tố ảnh hưởng.
C. Tổ chức sự kiện teambuilding.
D. Quản lý chấm công hàng ngày.
30. Trong quản lý rủi ro tài chính, mô hình 'credit scoring′ sử dụng khoa học dữ liệu để làm gì?
A. Dự báo biến động lãi suất.
B. Đánh giá khả năng trả nợ của khách hàng.
C. Phát hiện giao dịch rửa tiền.
D. Tối ưu hóa danh mục đầu tư.