Đề 4 - Bài tập, đề thi trắc nghiệm online Khoa học dữ liệu trong kinh tế và kinh doanh
1. Kỹ thuật 'Dimensionality Reduction′ (Giảm chiều dữ liệu) có lợi ích gì trong Khoa học dữ liệu?
A. Giảm độ phức tạp tính toán và cải thiện hiệu suất mô hình.
B. Tăng số lượng biến đầu vào để mô hình chính xác hơn.
C. Tạo ra dữ liệu mới từ dữ liệu hiện có.
D. Tăng cường khả năng trực quan hóa dữ liệu nhiều chiều.
2. Đâu là một ví dụ về dữ liệu 'phi cấu trúc′ (unstructured data) thường gặp trong kinh doanh?
A. Đánh giá của khách hàng trên mạng xã hội.
B. Bảng dữ liệu bán hàng hàng ngày.
C. Cơ sở dữ liệu quan hệ khách hàng (CRM).
D. Báo cáo tài chính của công ty.
3. Đâu KHÔNG phải là một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực Marketing?
A. Dự báo thời tiết để tối ưu hóa chiến dịch quảng cáo ngoài trời.
B. Phân khúc khách hàng để cá nhân hóa trải nghiệm.
C. Đề xuất sản phẩm dựa trên lịch sử mua hàng.
D. Đánh giá hiệu quả của các kênh marketing khác nhau.
4. Đạo đức trong Khoa học dữ liệu kinh doanh đề cập đến vấn đề nào là quan trọng nhất?
A. Bảo vệ quyền riêng tư và dữ liệu cá nhân của khách hàng.
B. Sử dụng công nghệ tiên tiến nhất để tối ưu hóa lợi nhuận.
C. Tự động hóa hoàn toàn quy trình ra quyết định kinh doanh.
D. Công khai toàn bộ dữ liệu kinh doanh cho mục đích minh bạch.
5. Trong phân tích rủi ro tín dụng, Khoa học dữ liệu giúp các tổ chức tài chính làm gì?
A. Đánh giá khả năng trả nợ của khách hàng và dự đoán rủi ro vỡ nợ.
B. Tối đa hóa lợi nhuận từ các khoản vay bằng mọi giá.
C. Giảm lãi suất cho vay để thu hút nhiều khách hàng hơn.
D. Loại bỏ hoàn toàn rủi ro tín dụng trong hoạt động cho vay.
6. Thách thức lớn nhất khi ứng dụng Khoa học dữ liệu trong kinh doanh thường liên quan đến vấn đề nào?
A. Chất lượng dữ liệu và khả năng tích hợp dữ liệu từ nhiều nguồn.
B. Sự thiếu hụt các công cụ và nền tảng công nghệ phù hợp.
C. Chi phí đầu tư ban đầu quá cao cho hạ tầng và nhân lực.
D. Sự phản kháng từ nhân viên không quen với công nghệ mới.
7. Trong phân tích chuỗi thời gian (Time Series Analysis), mục tiêu chính là gì?
A. Phân tích dữ liệu theo thời gian để tìm ra xu hướng và dự báo.
B. Phân tích dữ liệu tĩnh tại một thời điểm cụ thể.
C. So sánh dữ liệu giữa các nhóm khác nhau tại cùng một thời điểm.
D. Phân tích dữ liệu không có yếu tố thời gian.
8. Ưu điểm chính của việc ra quyết định dựa trên dữ liệu (data-driven decision making) so với quyết định trực giác là gì?
A. Giảm thiểu rủi ro và tăng tính khách quan, có căn cứ.
B. Đưa ra quyết định nhanh chóng hơn trong mọi tình huống.
C. Tiết kiệm chi phí thu thập và phân tích thông tin.
D. Phát huy tối đa kinh nghiệm và bản năng của nhà quản lý.
9. Mô hình 'Random Forest′ thường được sử dụng cho loại bài toán nào trong kinh tế và kinh doanh?
A. Cả bài toán phân loại và hồi quy.
B. Chỉ bài toán phân loại.
C. Chỉ bài toán hồi quy.
D. Bài toán giảm chiều dữ liệu.
10. Quy trình 'CRISP-DM′ là gì trong Khoa học dữ liệu?
A. Một mô hình quy trình chuẩn cho các dự án khai thác dữ liệu.
B. Một ngôn ngữ lập trình chuyên dụng cho phân tích dữ liệu kinh doanh.
C. Một thuật toán học máy phổ biến để dự báo chuỗi thời gian.
D. Một phương pháp trực quan hóa dữ liệu để trình bày kết quả phân tích.
11. Để đánh giá hiệu quả của một mô hình phân loại trong kinh doanh, chỉ số nào sau đây thường được sử dụng?
A. Độ chính xác (Accuracy) và độ bao phủ (Recall).
B. Giá trị trung bình (Mean) và độ lệch chuẩn (Standard Deviation).
C. Hệ số tương quan (Correlation Coefficient).
D. P-value.
12. Trong lĩnh vực tài chính, Khoa học dữ liệu được ứng dụng để phát hiện gian lận bằng cách nào?
A. Xác định các giao dịch bất thường và khác biệt so với hành vi thông thường.
B. Tăng cường bảo mật hệ thống thông tin để ngăn chặn truy cập trái phép.
C. Tuân thủ nghiêm ngặt các quy định pháp luật về phòng chống rửa tiền.
D. Kiểm toán độc lập để xác minh tính chính xác của báo cáo tài chính.
13. Công cụ lập trình phổ biến nào thường được sử dụng trong Khoa học dữ liệu cho kinh tế và kinh doanh?
A. Python.
B. Java.
C. C++.
D. Assembly.
14. Trong lĩnh vực chuỗi cung ứng, Khoa học dữ liệu có thể giúp ích trong việc nào sau đây?
A. Tối ưu hóa quản lý hàng tồn kho và dự báo nhu cầu.
B. Thay thế hoàn toàn con người trong quy trình vận hành.
C. Giảm chi phí marketing và quảng cáo.
D. Tăng giá bán sản phẩm để tối đa hóa lợi nhuận.
15. Khi nào thì việc sử dụng các mô hình học máy phức tạp (ví dụ: mạng nơ-ron sâu) trở nên cần thiết trong kinh doanh?
A. Khi bài toán có độ phức tạp cao và dữ liệu lớn, phi tuyến tính.
B. Khi cần giải quyết các bài toán đơn giản với dữ liệu nhỏ.
C. Khi muốn tiết kiệm chi phí tính toán và thời gian huấn luyện mô hình.
D. Khi các mô hình tuyến tính truyền thống luôn cho kết quả tốt.
16. Trong ngữ cảnh Khoa học dữ liệu, 'feature engineering′ (kỹ thuật tạo đặc trưng) là gì?
A. Quá trình chọn lọc và biến đổi dữ liệu thô để tạo ra các đặc trưng phù hợp cho mô hình học máy.
B. Quá trình đánh giá hiệu suất của mô hình học máy.
C. Quá trình triển khai mô hình học máy vào thực tế.
D. Quá trình thu thập và làm sạch dữ liệu ban đầu.
17. Phương pháp nào sau đây KHÔNG thuộc lĩnh vực Khoa học dữ liệu ứng dụng trong kinh tế?
A. Phân tích hồi quy để dự báo doanh số bán hàng.
B. Khai thác dữ liệu để phân khúc khách hàng.
C. Thử nghiệm A∕B để tối ưu hóa trang web thương mại điện tử.
D. Phân tích SWOT để đánh giá đối thủ cạnh tranh.
18. Vai trò của 'Data Visualization′ (Trực quan hóa dữ liệu) trong Khoa học dữ liệu kinh doanh là gì?
A. Giúp truyền đạt thông tin và kết quả phân tích một cách dễ hiểu.
B. Thay thế hoàn toàn các phương pháp phân tích thống kê truyền thống.
C. Tự động hóa quá trình thu thập và làm sạch dữ liệu.
D. Tăng độ phức tạp của mô hình phân tích dữ liệu.
19. Ứng dụng của Khoa học dữ liệu trong lĩnh vực Y tế và Chăm sóc sức khỏe có thể chuyển giao sang lĩnh vực kinh tế và kinh doanh ở khía cạnh nào?
A. Dự đoán và quản lý rủi ro, cá nhân hóa dịch vụ.
B. Tự động hóa phẫu thuật và điều trị bệnh nhân.
C. Thay thế hoàn toàn bác sĩ và nhân viên y tế.
D. Nghiên cứu và phát triển thuốc mới.
20. Trong bối cảnh kinh doanh, 'dữ liệu lớn′ (Big Data) thường được mô tả bởi đặc điểm nào sau đây?
A. Dung lượng lớn, tốc độ cao, và sự đa dạng.
B. Tính cấu trúc chặt chẽ và dễ dàng truy cập.
C. Nguồn gốc dữ liệu tập trung và có kiểm soát.
D. Khả năng xử lý bằng các công cụ thống kê truyền thống.
21. Phân tích 'Sentiment Analysis′ (Phân tích cảm xúc) thường được ứng dụng để làm gì trong kinh doanh?
A. Đánh giá thái độ và ý kiến của khách hàng từ văn bản.
B. Đo lường hiệu quả của chiến dịch quảng cáo trực tuyến.
C. Dự báo biến động giá cổ phiếu trên thị trường chứng khoán.
D. Phân tích cấu trúc và mối quan hệ giữa các thực thể kinh tế.
22. Kỹ thuật 'Clustering′ (Phân cụm) được sử dụng trong phân tích dữ liệu kinh doanh nhằm mục đích gì?
A. Nhóm các đối tượng tương tự nhau thành các cụm dựa trên đặc điểm.
B. Xây dựng mô hình để phân loại đối tượng vào các nhóm định trước.
C. Tìm kiếm mối quan hệ nhân quả giữa các biến số khác nhau.
D. Dự đoán giá trị của một biến số mục tiêu dựa trên các biến số đầu vào.
23. Mô hình học máy 'Support Vector Machine′ (SVM) thường được sử dụng cho bài toán nào?
A. Phân loại.
B. Hồi quy tuyến tính.
C. Phân cụm.
D. Giảm chiều dữ liệu.
24. Đâu KHÔNG phải là một kỹ năng quan trọng đối với một chuyên gia Khoa học dữ liệu trong kinh doanh?
A. Khả năng giao tiếp và trình bày kết quả phân tích.
B. Kiến thức sâu rộng về lập trình và thuật toán học máy.
C. Kỹ năng thiết kế đồ họa chuyên nghiệp.
D. Hiểu biết về lĩnh vực kinh doanh và vấn đề cần giải quyết.
25. Trong Khoa học dữ liệu, 'overfitting′ (quá khớp) đề cập đến vấn đề gì?
A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình không học được các mẫu từ dữ liệu huấn luyện.
C. Dữ liệu huấn luyện quá nhỏ so với độ phức tạp của mô hình.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
26. Thuật ngữ 'Data Mining′ (Khai thác dữ liệu) trong kinh tế và kinh doanh chủ yếu liên quan đến hoạt động nào?
A. Tìm kiếm các mẫu và tri thức ẩn từ lượng lớn dữ liệu.
B. Thu thập và lưu trữ dữ liệu một cách có hệ thống.
C. Trực quan hóa dữ liệu để tạo báo cáo dễ hiểu.
D. Đảm bảo chất lượng và tính toàn vẹn của dữ liệu.
27. Đâu là vai trò chính của Khoa học dữ liệu trong kinh tế và kinh doanh hiện đại?
A. Tối ưu hóa các quy trình hoạt động và ra quyết định dựa trên bằng chứng.
B. Thay thế hoàn toàn các phương pháp kinh tế học truyền thống.
C. Giảm thiểu sự phụ thuộc vào công nghệ thông tin trong doanh nghiệp.
D. Hạn chế sự sáng tạo và đổi mới trong mô hình kinh doanh.
28. Đâu là một ví dụ về ứng dụng Khoa học dữ liệu trong quản lý nguồn nhân lực (HR)?
A. Dự đoán tỷ lệ nhân viên nghỉ việc và tối ưu hóa quy trình tuyển dụng.
B. Tự động hóa hoàn toàn các hoạt động quản lý nhân sự.
C. Giảm lương nhân viên để tăng lợi nhuận công ty.
D. Thay thế nhân viên bằng robot trong mọi công việc.
29. Mục tiêu chính của việc sử dụng mô hình dự báo trong kinh doanh là gì?
A. Đưa ra các ước tính về xu hướng và kết quả trong tương lai.
B. Ghi lại và mô tả các sự kiện đã xảy ra trong quá khứ.
C. Giải thích nguyên nhân gốc rễ của các vấn đề hiện tại.
D. Xác định các rủi ro tiềm ẩn trong môi trường kinh doanh.
30. Phương pháp 'A∕B testing′ được sử dụng để làm gì trong kinh doanh trực tuyến?
A. So sánh hiệu quả của hai phiên bản khác nhau của một yếu tố (ví dụ: trang web, quảng cáo).
B. Phân tích hành vi người dùng trên trang web để cải thiện trải nghiệm.
C. Thu thập dữ liệu về nhân khẩu học của khách hàng trực tuyến.
D. Tối ưu hóa công cụ tìm kiếm (SEO) cho trang web.