Đề 3 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Thuật ngữ 'big data′ trong kinh tế và kinh doanh thường đề cập đến dữ liệu có đặc điểm nào sau đây?
A. Dữ liệu có cấu trúc rõ ràng và dễ dàng quản lý.
B. Dữ liệu có kích thước lớn, tốc độ tạo ra nhanh và đa dạng về loại hình.
C. Dữ liệu chỉ bao gồm các con số và văn bản.
D. Dữ liệu được lưu trữ trên các thiết bị cá nhân.
2. Phương pháp 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong học máy?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá khả năng tổng quát hóa (generalization) của mô hình trên dữ liệu mới.
C. Làm sạch dữ liệu kiểm thử.
D. Trực quan hóa kết quả mô hình.
3. Phương pháp nào sau đây giúp đánh giá mức độ quan trọng của từng biến đầu vào (feature importance) trong một mô hình học máy?
A. Phân tích phương sai (ANOVA).
B. Đánh giá độ chính xác (Accuracy score).
C. Permutation Importance hoặc các phương pháp tương tự.
D. Phân tích tương quan (Correlation analysis).
4. Mục tiêu của việc 'tối ưu hóa mô hình′ (model optimization) trong học máy là gì?
A. Giảm kích thước mô hình.
B. Cải thiện hiệu suất dự đoán và∕hoặc tốc độ của mô hình.
C. Làm cho mô hình dễ hiểu hơn.
D. Trực quan hóa mô hình.
5. Trong lĩnh vực kinh doanh, kỹ thuật phân cụm (clustering) thường được sử dụng để:
A. Dự đoán doanh thu bán hàng trong tương lai.
B. Phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung.
C. Đánh giá rủi ro tín dụng của khách hàng.
D. Tối ưu hóa chuỗi cung ứng.
6. Trong phân tích rủi ro tín dụng (credit risk analysis), mô hình học máy được sử dụng để:
A. Đảm bảo 100% khách hàng trả nợ đúng hạn.
B. Dự đoán khả năng khách hàng vỡ nợ và đánh giá mức độ rủi ro.
C. Tăng lãi suất cho vay cho mọi khách hàng.
D. Loại bỏ hoàn toàn rủi ro tín dụng.
7. Đâu là một ví dụ về việc sử dụng khoa học dữ liệu để cải thiện dịch vụ khách hàng?
A. Tăng giá sản phẩm.
B. Xây dựng chatbot hỗ trợ khách hàng tự động và hiệu quả.
C. Giảm số lượng nhân viên hỗ trợ khách hàng.
D. Hạn chế kênh liên lạc với khách hàng.
8. Đâu là vai trò quan trọng nhất của khoa học dữ liệu trong việc dự báo kinh tế?
A. Giảm thiểu chi phí thu thập dữ liệu.
B. Cung cấp các mô hình dự báo chính xác hơn và kịp thời hơn.
C. Tăng cường khả năng bảo mật dữ liệu kinh tế.
D. Tự động hóa quy trình nhập liệu kinh tế.
9. Trong lĩnh vực kinh tế, khoa học dữ liệu có thể hỗ trợ việc phân tích chính sách công như thế nào?
A. Thay thế hoàn toàn vai trò của nhà hoạch định chính sách.
B. Đánh giá hiệu quả của chính sách dựa trên dữ liệu thực tế và dự báo tác động của chính sách mới.
C. Giảm thiểu sự tham gia của cộng đồng vào quá trình hoạch định chính sách.
D. Đơn giản hóa các vấn đề kinh tế phức tạp.
10. Khoa học dữ liệu trong kinh tế và kinh doanh chủ yếu tập trung vào việc:
A. Thu thập và lưu trữ dữ liệu.
B. Phân tích dữ liệu để đưa ra quyết định kinh doanh và hiểu biết kinh tế.
C. Phát triển phần mềm quản lý dữ liệu.
D. Bảo mật hệ thống mạng cho doanh nghiệp.
11. Mô hình học máy (machine learning) nào thường được sử dụng để dự đoán giá nhà dựa trên các yếu tố như diện tích, vị trí, số phòng ngủ?
A. Hồi quy tuyến tính (Linear Regression).
B. Phân loại Logistic (Logistic Regression).
C. Cây quyết định (Decision Tree).
D. K-Means Clustering.
12. Trong kinh tế học hành vi (behavioral economics), khoa học dữ liệu có thể giúp:
A. Loại bỏ hoàn toàn yếu tố tâm lý con người khỏi các mô hình kinh tế.
B. Phân tích và mô hình hóa hành vi ra quyết định của con người, thường không hoàn toàn lý trí.
C. Chỉ tập trung vào các quyết định kinh tế dựa trên lý thuyết kinh tế cổ điển.
D. Đơn giản hóa hành vi con người thành các quy tắc toán học đơn giản.
13. Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong chuỗi cung ứng?
A. Thiết kế logo sản phẩm.
B. Dự đoán nhu cầu hàng hóa để tối ưu hóa lượng tồn kho.
C. Quản lý tài khoản ngân hàng của công ty.
D. Tuyển dụng nhân viên mới.
14. Trong khoa học dữ liệu, 'feature engineering′ là quá trình:
A. Thu thập dữ liệu từ nhiều nguồn khác nhau.
B. Chọn lọc và biến đổi các biến đầu vào (features) để cải thiện hiệu suất mô hình.
C. Đánh giá hiệu suất của mô hình học máy.
D. Triển khai mô hình học máy vào thực tế.
15. Ứng dụng nào sau đây của khoa học dữ liệu giúp doanh nghiệp cá nhân hóa trải nghiệm khách hàng?
A. Phân tích SWOT.
B. Hệ thống gợi ý sản phẩm và nội dung cá nhân hóa.
C. Phân tích báo cáo tài chính.
D. Nghiên cứu thị trường truyền thống.
16. Công cụ trực quan hóa dữ liệu (data visualization) nào thường được sử dụng để hiển thị mối quan hệ giữa các biến số?
A. Biểu đồ tròn (Pie chart).
B. Biểu đồ đường (Line chart).
C. Biểu đồ phân tán (Scatter plot).
D. Biểu đồ cột (Bar chart).
17. Trong bối cảnh cạnh tranh, khoa học dữ liệu giúp doanh nghiệp đạt lợi thế cạnh tranh bằng cách nào?
A. Giảm chi phí đầu tư vào công nghệ.
B. Đưa ra quyết định nhanh chóng và chính xác hơn dựa trên dữ liệu, tối ưu hóa hoạt động và cá nhân hóa trải nghiệm khách hàng.
C. Hạn chế sự sáng tạo trong kinh doanh.
D. Đơn giản hóa chiến lược kinh doanh.
18. Trong phân tích dữ liệu, 'outlier′ (giá trị ngoại lệ) là gì?
A. Dữ liệu bị thiếu.
B. Dữ liệu không chính xác.
C. Giá trị dữ liệu khác biệt đáng kể so với phần lớn dữ liệu còn lại.
D. Dữ liệu đã được xử lý và làm sạch.
19. Đâu là một thách thức đạo đức quan trọng khi ứng dụng khoa học dữ liệu trong kinh doanh?
A. Sự khan hiếm các công cụ phân tích dữ liệu.
B. Sử dụng dữ liệu cá nhân mà không có sự đồng ý hoặc minh bạch.
C. Chi phí đầu tư vào cơ sở hạ tầng dữ liệu quá cao.
D. Khó khăn trong việc thu thập dữ liệu từ thị trường.
20. Trong khoa học dữ liệu, 'bias′ (thiên vị) có thể xuất hiện từ đâu?
A. Do sử dụng công cụ phân tích dữ liệu không phù hợp.
B. Do dữ liệu huấn luyện không đại diện cho toàn bộ quần thể hoặc do thiên vị trong quá trình thu thập dữ liệu.
C. Do mô hình học máy quá phức tạp.
D. Do thiếu dữ liệu.
21. Khái niệm 'interpretability′ (khả năng diễn giải) của mô hình học máy quan trọng trong kinh doanh vì:
A. Mô hình dễ diễn giải luôn có độ chính xác cao hơn.
B. Giúp hiểu rõ cơ chế hoạt động của mô hình và lý do đưa ra quyết định, tăng tính minh bạch và tin cậy.
C. Mô hình dễ diễn giải luôn chạy nhanh hơn.
D. Mô hình dễ diễn giải luôn cần ít dữ liệu huấn luyện hơn.
22. Mục tiêu chính của việc 'làm sạch dữ liệu′ (data cleaning) trong quy trình khoa học dữ liệu là gì?
A. Tăng kích thước tập dữ liệu.
B. Loại bỏ hoặc sửa chữa dữ liệu sai sót, không đầy đủ hoặc không nhất quán.
C. Mã hóa dữ liệu để bảo mật.
D. Trực quan hóa dữ liệu.
23. Phương pháp 'A∕B testing′ trong marketing là một ứng dụng của khoa học dữ liệu, chủ yếu dùng để:
A. Phân tích dữ liệu đối thủ cạnh tranh.
B. So sánh hiệu quả của hai phiên bản khác nhau của một chiến dịch marketing.
C. Dự báo xu hướng thị trường.
D. Đo lường mức độ hài lòng của khách hàng.
24. Kỹ thuật 'Natural Language Processing′ (NLP) được ứng dụng trong kinh doanh để:
A. Phân tích dữ liệu số liệu bán hàng.
B. Phân tích cảm xúc (sentiment analysis) từ phản hồi của khách hàng bằng văn bản.
C. Dự báo giá cổ phiếu.
D. Tối ưu hóa quy trình sản xuất.
25. Kỹ thuật 'dimensionality reduction′ (giảm chiều dữ liệu) được sử dụng khi làm việc với dữ liệu:
A. Có quá ít biến số.
B. Có quá nhiều biến số, gây khó khăn trong phân tích và tính toán.
C. Dữ liệu không có cấu trúc.
D. Dữ liệu đã được làm sạch.
26. Trong lĩnh vực nhân sự (HR), khoa học dữ liệu có thể giúp ích nhất trong việc:
A. Tự động hóa hoàn toàn quy trình tuyển dụng mà không cần con người.
B. Dự đoán tỷ lệ nhân viên nghỉ việc và xác định yếu tố ảnh hưởng.
C. Thay thế hoàn toàn vai trò của quản lý nhân sự.
D. Giảm thiểu chi phí đào tạo nhân viên.
27. Trong kinh doanh trực tuyến (e-commerce), hệ thống gợi ý sản phẩm (recommendation system) là một ứng dụng của:
A. Hệ thống quản lý cơ sở dữ liệu.
B. Khoa học dữ liệu và học máy.
C. Hệ thống hoạch định nguồn lực doanh nghiệp (ERP).
D. Hệ thống quản lý quan hệ khách hàng (CRM).
28. Phân tích chuỗi thời gian (time series analysis) đặc biệt hữu ích trong kinh tế và kinh doanh để:
A. Phân tích dữ liệu hình ảnh.
B. Dự báo các xu hướng và mô hình theo thời gian, ví dụ như dự báo doanh số hàng tháng.
C. Phân tích dữ liệu văn bản.
D. Xây dựng mô hình phân loại khách hàng.
29. Công cụ khai thác dữ liệu (data mining) nào thường được sử dụng để tìm ra các quy luật kết hợp, ví dụ như 'khách hàng mua sản phẩm A cũng thường mua sản phẩm B′?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích luật kết hợp (Association rule mining).
C. Phân tích chuỗi thời gian (Time series analysis).
D. Phân tích phương sai (ANOVA).
30. Trong quản lý rủi ro tài chính, khoa học dữ liệu có thể được sử dụng để:
A. Tăng cường lợi nhuận đầu tư chắc chắn.
B. Phát hiện gian lận và mô hình giao dịch bất thường.
C. Loại bỏ hoàn toàn rủi ro thị trường.
D. Đơn giản hóa quy trình kế toán.