Trắc nghiệm Kết nối Tin học 11 Tin học ứng dụng Kết nối Bài 10 Lưu trữ dữ liệu và khai thác thông tin phục vụ và quản lý
1. Mục tiêu của Data Cleansing (Làm sạch dữ liệu) là gì?
A. Phát hiện và sửa chữa các lỗi, sai sót, thiếu sót hoặc không nhất quán trong dữ liệu.
B. Tăng dung lượng lưu trữ của cơ sở dữ liệu.
C. Bảo mật dữ liệu bằng cách ẩn thông tin nhạy cảm.
D. Tạo ra các bản sao lưu định kỳ của dữ liệu.
2. Việc chuẩn hóa cơ sở dữ liệu (Database Normalization) có mục tiêu chính là gì?
A. Giảm thiểu sự dư thừa dữ liệu và cải thiện tính toàn vẹn của dữ liệu.
B. Tăng tốc độ truy xuất dữ liệu cho mọi loại truy vấn.
C. Đơn giản hóa việc thiết kế giao diện người dùng.
D. Tự động hóa quá trình sao lưu dữ liệu.
3. Mục đích chính của việc sử dụng Data Mining trong quản lý là gì?
A. Khám phá các mẫu, xu hướng và mối quan hệ ẩn trong các tập dữ liệu lớn để hỗ trợ ra quyết định.
B. Sao lưu toàn bộ dữ liệu của tổ chức để phòng ngừa mất mát.
C. Tự động hóa quá trình nhập liệu thủ công.
D. Bảo mật dữ liệu khỏi các truy cập trái phép.
4. Việc sử dụng Data Masking trong quản lý dữ liệu nhằm mục đích gì?
A. Che giấu hoặc làm xáo trộn dữ liệu nhạy cảm để bảo vệ quyền riêng tư trong môi trường thử nghiệm hoặc phát triển.
B. Tăng tốc độ truy cập vào cơ sở dữ liệu.
C. Giảm dung lượng lưu trữ của dữ liệu.
D. Tự động hóa quá trình sao lưu dữ liệu.
5. Khi nói về Big Data, yếu tố nào sau đây không được xem là một trong ba V truyền thống?
A. Value (Giá trị)
B. Volume (Khối lượng)
C. Velocity (Tốc độ)
D. Variety (Đa dạng)
6. Một Database Management System (DBMS) có vai trò cốt lõi là gì trong việc quản lý dữ liệu?
A. Cung cấp một giao diện để người dùng tạo, truy vấn, cập nhật và quản lý dữ liệu một cách có cấu trúc.
B. Phát triển các thuật toán trí tuệ nhân tạo.
C. Thiết kế phần cứng cho máy chủ lưu trữ.
D. Tạo ra các chiến lược tiếp thị dựa trên dữ liệu.
7. Khi phân tích dữ liệu, Phân tích dự đoán (Predictive Analytics) nhằm mục đích gì?
A. Sử dụng dữ liệu lịch sử để dự báo các xu hướng hoặc kết quả trong tương lai.
B. Mô tả các sự kiện đã xảy ra trong quá khứ.
C. Phân tích nguyên nhân gốc rễ của một vấn đề.
D. Tối ưu hóa các quy trình hiện tại.
8. Trong phân tích dữ liệu, Data Visualization đóng vai trò quan trọng nhất là gì?
A. Biến đổi dữ liệu phức tạp thành các biểu đồ, đồ thị dễ hiểu để truyền đạt thông tin hiệu quả.
B. Lưu trữ an toàn các tệp tin dữ liệu.
C. Tự động làm sạch dữ liệu bị lỗi.
D. Tạo ra các mô hình dự đoán.
9. Khi nói về Data Analytics, Phân tích mô tả (Descriptive Analytics) tập trung vào câu hỏi nào?
A. Điều gì đã xảy ra?
B. Điều gì sẽ xảy ra?
C. Tại sao điều đó xảy ra?
D. Chúng ta nên làm gì?
10. Trong các loại cơ sở dữ liệu, Cơ sở dữ liệu đồ thị (Graph Database) phù hợp nhất cho việc quản lý loại thông tin nào?
A. Dữ liệu mô tả mối quan hệ phức tạp giữa các thực thể, ví dụ như mạng xã hội hoặc hệ thống gợi ý.
B. Dữ liệu bảng có cấu trúc chuẩn hóa cao.
C. Dữ liệu chuỗi thời gian.
D. Dữ liệu văn bản lớn.
11. Một hệ thống Business Intelligence (BI) thường bao gồm những thành phần chính nào?
A. Các công cụ thu thập, lưu trữ, phân tích dữ liệu và trình bày kết quả dưới dạng báo cáo, biểu đồ.
B. Phần cứng máy chủ và thiết bị mạng.
C. Các quy trình vận hành nội bộ của doanh nghiệp.
D. Phần mềm quản lý dự án.
12. Khi đánh giá chất lượng dữ liệu, các yếu tố như tính đầy đủ, tính nhất quán và tính chính xác thuộc về khía cạnh nào?
A. Data Quality (Chất lượng dữ liệu).
B. Data Security (Bảo mật dữ liệu).
C. Data Governance (Quản trị dữ liệu).
D. Data Privacy (Quyền riêng tư dữ liệu).
13. Trong mô hình dữ liệu quan hệ, Khóa chính (Primary Key) có chức năng gì?
A. Đảm bảo mỗi bản ghi (row) trong bảng có một định danh duy nhất và không lặp lại.
B. Liên kết dữ liệu giữa hai bảng khác nhau.
C. Xác định loại dữ liệu của một cột.
D. Tạo ra các chỉ mục để tăng tốc độ truy vấn.
14. Trong ngữ cảnh quản lý dữ liệu, thuật ngữ Data Warehousing chủ yếu đề cập đến quá trình nào?
A. Tạo và duy trì một kho dữ liệu tập trung, tích hợp từ nhiều nguồn khác nhau, phục vụ cho mục đích phân tích và báo cáo.
B. Xây dựng các ứng dụng di động để truy cập và quản lý dữ liệu.
C. Thiết kế giao diện người dùng cho các hệ thống cơ sở dữ liệu.
D. Tối ưu hóa tốc độ truy vấn cho các giao dịch trực tuyến.
15. Tại sao việc phân tích dữ liệu khách hàng lại quan trọng đối với các doanh nghiệp hiện đại?
A. Giúp hiểu rõ hành vi, sở thích của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số.
B. Giảm chi phí nhân sự bằng cách thay thế hoàn toàn nhân viên chăm sóc khách hàng.
C. Đảm bảo tất cả dữ liệu khách hàng đều được lưu trữ trên đám mây.
D. Tăng cường bảo mật thông tin bằng cách mã hóa toàn bộ dữ liệu khách hàng.
16. Thuật ngữ Data Governance liên quan đến việc thiết lập gì trong tổ chức?
A. Các chính sách, quy trình và tiêu chuẩn để quản lý, sử dụng và bảo vệ dữ liệu.
B. Các chiến lược marketing và bán hàng.
C. Các quy định về an toàn lao động.
D. Các phương pháp phát triển phần mềm.
17. Trong các loại dữ liệu, Dữ liệu phi cấu trúc (Unstructured Data) là loại dữ liệu nào?
A. Dữ liệu không có cấu trúc định sẵn, ví dụ như văn bản, hình ảnh, video, âm thanh.
B. Dữ liệu được tổ chức thành các hàng và cột trong bảng.
C. Dữ liệu được lưu trữ trong các tệp tin XML.
D. Dữ liệu có định dạng JSON.
18. Trong hệ thống quản lý dữ liệu, Data Dictionary cung cấp thông tin gì?
A. Mô tả chi tiết về các bảng, trường dữ liệu, kiểu dữ liệu, ràng buộc và mối quan hệ trong cơ sở dữ liệu.
B. Lịch sử các lần thay đổi cấu trúc cơ sở dữ liệu.
C. Báo cáo về hiệu suất hoạt động của hệ thống.
D. Thông tin về người dùng truy cập cơ sở dữ liệu.
19. Mục đích chính của việc triển khai Master Data Management (MDM) là gì?
A. Tạo ra một nguồn dữ liệu thống nhất và đáng tin cậy cho các thực thể kinh doanh cốt lõi (ví dụ: khách hàng, sản phẩm).
B. Tăng cường bảo mật mạng cho toàn bộ tổ chức.
C. Tự động hóa các quy trình sản xuất.
D. Phát triển các ứng dụng di động mới.
20. Trong lĩnh vực khai thác thông tin, ETL (Extract, Transform, Load) là một quy trình thiết yếu cho hoạt động nào?
A. Tích hợp dữ liệu từ nhiều nguồn khác nhau vào một kho dữ liệu chung.
B. Bảo vệ dữ liệu khỏi các cuộc tấn công mạng.
C. Phân tích hiệu suất của các ứng dụng web.
D. Tạo ra các báo cáo tài chính tự động.
21. Trong các phương pháp lưu trữ dữ liệu, NoSQL database thường được ưu tiên cho các ứng dụng có đặc điểm gì?
A. Yêu cầu tính linh hoạt cao về cấu trúc dữ liệu và khả năng mở rộng theo chiều ngang.
B. Cần tuân thủ nghiêm ngặt các quy tắc về toàn vẹn dữ liệu (ACID).
C. Chỉ lưu trữ dữ liệu có cấu trúc bảng rõ ràng.
D. Yêu cầu các truy vấn phức tạp với nhiều phép nối bảng.
22. Trong phân tích dữ liệu, OLAP (Online Analytical Processing) khác biệt với OLTP (Online Transaction Processing) ở điểm nào?
A. OLAP tập trung vào phân tích dữ liệu phức tạp và báo cáo, trong khi OLTP tập trung vào xử lý các giao dịch hàng ngày.
B. OLAP sử dụng các bảng đơn giản, còn OLTP sử dụng các bảng phức tạp.
C. OLAP yêu cầu ít dung lượng lưu trữ hơn OLTP.
D. OLAP chỉ xử lý dữ liệu mới, còn OLTP xử lý dữ liệu lịch sử.
23. Việc áp dụng Cloud Computing trong lưu trữ và khai thác dữ liệu mang lại lợi ích chính nào?
A. Khả năng mở rộng linh hoạt, giảm chi phí hạ tầng và truy cập dữ liệu mọi lúc, mọi nơi.
B. Tăng cường kiểm soát vật lý đối với máy chủ lưu trữ.
C. Giảm thiểu nhu cầu về nhân lực quản lý hệ thống.
D. Hạn chế khả năng truy cập dữ liệu từ bên ngoài.
24. Khái niệm Metadata trong quản lý dữ liệu đề cập đến điều gì?
A. Dữ liệu mô tả về dữ liệu khác, ví dụ như định dạng, nguồn gốc, hoặc ý nghĩa của một trường dữ liệu.
B. Các tệp tin chứa dữ liệu người dùng cuối.
C. Các chương trình phần mềm để truy cập dữ liệu.
D. Các bản ghi về các lỗi xảy ra trong quá trình xử lý dữ liệu.
25. Một Data Lake khác biệt với Data Warehouse ở chỗ nào?
A. Data Lake lưu trữ dữ liệu thô ở định dạng gốc, trong khi Data Warehouse lưu trữ dữ liệu đã được xử lý và định dạng.
B. Data Lake chỉ dành cho dữ liệu có cấu trúc, còn Data Warehouse cho cả dữ liệu có cấu trúc và phi cấu trúc.
C. Data Lake tập trung vào giao dịch, còn Data Warehouse tập trung vào phân tích.
D. Data Lake có khả năng mở rộng kém hơn Data Warehouse.