Đề 9 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Trong khoa học dữ liệu, 'mô hình hóa′ (modeling) dữ liệu nhằm mục đích gì?
A. Làm cho dữ liệu trở nên phức tạp hơn.
B. Đơn giản hóa và biểu diễn dữ liệu dưới dạng dễ hiểu, phục vụ phân tích và dự đoán.
C. Xóa bỏ dữ liệu không liên quan.
D. Tăng kích thước của tập dữ liệu.
2. Mục tiêu chính của việc sử dụng thuật toán phân cụm (clustering) trong phân tích dữ liệu khách hàng là gì?
A. Dự đoán giá trị vòng đời khách hàng.
B. Phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm chung.
C. Xác định khách hàng nào có khả năng rời bỏ dịch vụ.
D. Đánh giá mức độ hài lòng của khách hàng.
3. Trong khoa học dữ liệu, 'overfitting′ (quá khớp) mô hình có nghĩa là:
A. Mô hình quá đơn giản và không thể học được từ dữ liệu.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
D. Mô hình cần thêm dữ liệu để cải thiện hiệu suất.
4. Trong khoa học dữ liệu, 'dữ liệu sạch′ (clean data) có nghĩa là dữ liệu:
A. Dữ liệu đã được mã hóa.
B. Dữ liệu không chứa lỗi, giá trị thiếu hoặc không nhất quán.
C. Dữ liệu được lưu trữ trên đám mây.
D. Dữ liệu được thu thập từ nguồn đáng tin cậy.
5. Đâu là ví dụ về dữ liệu 'phi cấu trúc′ thường gặp trong kinh doanh?
A. Doanh thu hàng tháng.
B. Đánh giá và bình luận của khách hàng trên mạng xã hội.
C. Địa chỉ email khách hàng.
D. Số lượng sản phẩm tồn kho.
6. Đâu là một ví dụ về ứng dụng khoa học dữ liệu trong lĩnh vực tài chính ngân hàng?
A. In hóa đơn giao dịch cho khách hàng.
B. Phát triển ứng dụng mobile banking.
C. Phát hiện giao dịch gian lận và rửa tiền.
D. Xây dựng trụ sở ngân hàng mới.
7. Trong quản lý rủi ro tài chính, khoa học dữ liệu có thể được ứng dụng để:
A. Loại bỏ hoàn toàn rủi ro thị trường.
B. Dự đoán và giảm thiểu rủi ro tín dụng, rủi ro hoạt động.
C. Tăng lãi suất tiền gửi để thu hút vốn.
D. Đảm bảo lợi nhuận tối đa cho mọi giao dịch tài chính.
8. Ứng dụng của khoa học dữ liệu trong quản lý nhân sự (HR) KHÔNG bao gồm:
A. Dự đoán tỷ lệ nhân viên nghỉ việc.
B. Tối ưu hóa quy trình tuyển dụng.
C. Tính lương và thưởng cho nhân viên.
D. Phân tích hiệu suất làm việc của nhân viên.
9. Trong chuỗi cung ứng, khoa học dữ liệu giúp tối ưu hóa yếu tố nào sau đây?
A. Giá bán sản phẩm đến người tiêu dùng cuối cùng.
B. Chi phí vận chuyển, tồn kho và dự báo nhu cầu.
C. Số lượng nhân viên trong bộ phận kho vận.
D. Thời gian làm việc của nhân viên giao hàng.
10. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khoa học dữ liệu trong lĩnh vực sản xuất?
A. Dự đoán nhu cầu thị trường.
B. Bảo trì dự đoán thiết bị máy móc.
C. Tối ưu hóa quy trình sản xuất.
D. Quản lý quan hệ khách hàng (CRM).
11. Trong lĩnh vực thương mại điện tử, hệ thống gợi ý sản phẩm (recommendation system) sử dụng kỹ thuật khoa học dữ liệu nào?
A. Phân tích cảm xúc (sentiment analysis).
B. Học máy (machine learning) và khai phá dữ liệu.
C. Xử lý ngôn ngữ tự nhiên (NLP).
D. Phân tích chuỗi thời gian (time series analysis).
12. Thuật ngữ 'khai phá dữ liệu′ (data mining) thường được hiểu là:
A. Quá trình nhập dữ liệu vào máy tính.
B. Quá trình tìm kiếm tri thức, mẫu hình ẩn sâu trong dữ liệu lớn.
C. Quá trình xóa dữ liệu cũ.
D. Quá trình mã hóa dữ liệu.
13. Trong kinh doanh, phân tích 'dự báo′ (predictive analytics) thường được sử dụng để:
A. Mô tả những gì đã xảy ra trong quá khứ.
B. Dự đoán những gì có thể xảy ra trong tương lai.
C. Giải thích tại sao một sự kiện đã xảy ra.
D. Đề xuất hành động để giải quyết vấn đề.
14. Phân tích 'mô tả' (descriptive analytics) trong kinh doanh tập trung vào việc:
A. Dự đoán các sự kiện trong tương lai.
B. Giải thích nguyên nhân của các sự kiện đã xảy ra.
C. Tóm tắt và mô tả những gì đã xảy ra trong quá khứ.
D. Đề xuất hành động để cải thiện hiệu suất.
15. Khi doanh nghiệp muốn hiểu 'tại sao′ doanh số bán hàng giảm sút trong quý vừa qua, loại phân tích nào sau đây là phù hợp nhất?
A. Phân tích mô tả (descriptive analytics).
B. Phân tích dự đoán (predictive analytics).
C. Phân tích chẩn đoán (diagnostic analytics).
D. Phân tích chỉ định (prescriptive analytics).
16. Trong bối cảnh kinh doanh trực tuyến, dữ liệu 'lớn′ (Big Data) thường được tạo ra từ nguồn nào sau đây?
A. Các cuộc khảo sát thị trường được thực hiện thủ công.
B. Hồ sơ nhân viên trong hệ thống quản lý nhân sự.
C. Tương tác của người dùng trên website và mạng xã hội.
D. Báo cáo tài chính hàng năm của doanh nghiệp.
17. Đâu là lợi ích chính của việc ứng dụng khoa học dữ liệu trong marketing?
A. Giảm chi phí thuê nhân viên marketing.
B. Tăng cường khả năng dự đoán hành vi và nhu cầu khách hàng.
C. Loại bỏ hoàn toàn sự cần thiết của các chiến dịch marketing truyền thống.
D. Đảm bảo 100% khách hàng hài lòng với sản phẩm.
18. Phương pháp nào sau đây KHÔNG thuộc về khoa học dữ liệu ứng dụng trong kinh doanh?
A. Phân tích hồi quy để dự báo doanh số.
B. Khai phá dữ liệu để phân khúc khách hàng.
C. Thử nghiệm A∕B để tối ưu hóa trang web.
D. Kiểm toán báo cáo tài chính theo chuẩn mực kế toán.
19. Trong phân tích chuỗi thời gian ứng dụng trong kinh tế, mục đích chính là:
A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự báo các giá trị tương lai dựa trên dữ liệu quá khứ.
C. Tìm ra mối quan hệ nhân quả giữa các biến số.
D. Tóm tắt dữ liệu bằng các thống kê mô tả.
20. Lợi ích chính của việc sử dụng 'dữ liệu có cấu trúc′ so với 'dữ liệu phi cấu trúc′ trong phân tích là gì?
A. Dữ liệu có cấu trúc luôn chính xác hơn dữ liệu phi cấu trúc.
B. Dữ liệu có cấu trúc dễ dàng truy vấn, phân tích và xử lý hơn.
C. Dữ liệu có cấu trúc có thể chứa nhiều thông tin hơn dữ liệu phi cấu trúc.
D. Dữ liệu có cấu trúc luôn có sẵn với số lượng lớn hơn.
21. Độ chính xác (accuracy) là một chỉ số quan trọng để đánh giá hiệu quả của mô hình nào trong khoa học dữ liệu?
A. Mô hình phân cụm (clustering).
B. Mô hình hồi quy (regression).
C. Mô hình phân loại (classification).
D. Mô hình giảm chiều dữ liệu (dimensionality reduction).
22. Đâu là một thách thức về mặt đạo đức khi sử dụng khoa học dữ liệu trong kinh doanh?
A. Chi phí đầu tư vào công nghệ.
B. Sự phức tạp của thuật toán học máy.
C. Sử dụng dữ liệu cá nhân của khách hàng mà không có sự đồng ý hoặc minh bạch.
D. Khó khăn trong việc trực quan hóa dữ liệu.
23. Kỹ thuật 'xử lý ngôn ngữ tự nhiên′ (NLP) được ứng dụng trong kinh doanh để làm gì?
A. Dự báo giá cổ phiếu.
B. Phân tích phản hồi của khách hàng từ văn bản (ví dụ: đánh giá sản phẩm).
C. Tối ưu hóa tốc độ website.
D. Quản lý cơ sở dữ liệu quan hệ.
24. Trong quy trình khoa học dữ liệu, bước nào sau đây thường diễn ra ĐẦU TIÊN?
A. Xây dựng mô hình dự đoán.
B. Thu thập và làm sạch dữ liệu.
C. Trực quan hóa dữ liệu.
D. Đánh giá và triển khai mô hình.
25. Khi nói về 'trực quan hóa dữ liệu′ trong kinh doanh, công cụ nào sau đây thường được sử dụng?
A. Máy tính lượng tử.
B. Phần mềm bảng tính (như Excel) và các công cụ BI (như Tableau, Power BI).
C. Hệ thống quản lý quan hệ khách hàng (CRM).
D. Phần mềm kế toán.
26. Công cụ lập trình phổ biến nhất trong khoa học dữ liệu hiện nay là:
A. Java.
B. C++.
C. Python.
D. HTML.
27. Khái niệm 'học máy không giám sát′ (unsupervised learning) khác biệt với 'học máy có giám sát′ (supervised learning) ở điểm nào?
A. Học máy không giám sát sử dụng nhiều dữ liệu hơn.
B. Học máy không giám sát không cần dữ liệu đầu vào.
C. Học máy không giám sát không sử dụng nhãn dữ liệu (labeled data).
D. Học máy không giám sát luôn cho kết quả chính xác hơn.
28. Đâu là thách thức lớn nhất khi triển khai khoa học dữ liệu trong các doanh nghiệp truyền thống?
A. Chi phí đầu tư vào phần mềm và phần cứng quá thấp.
B. Thiếu hụt nhân lực có kỹ năng phân tích dữ liệu và hiểu biết kinh doanh.
C. Dữ liệu thu thập được quá ít và không đa dạng.
D. Khả năng tiếp cận dữ liệu công khai quá dễ dàng.
29. Trong khoa học dữ liệu, 'tính năng′ (feature) của dữ liệu thường được hiểu là:
A. Toàn bộ tập dữ liệu.
B. Một thuộc tính hoặc cột trong tập dữ liệu được sử dụng để phân tích.
C. Một dòng dữ liệu cụ thể.
D. Định dạng lưu trữ dữ liệu.
30. Trong kinh tế và kinh doanh, khoa học dữ liệu chủ yếu tập trung vào việc:
A. Thu thập và lưu trữ dữ liệu lớn một cách hiệu quả.
B. Phân tích dữ liệu để khám phá tri thức và hỗ trợ quyết định.
C. Phát triển phần mềm quản lý cơ sở dữ liệu.
D. Tự động hóa quy trình nhập liệu dữ liệu.