1. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Big Data Analytics?
A. Dự đoán xu hướng thị trường và hành vi khách hàng.
B. Phát triển vũ khí hạt nhân.
C. Cá nhân hóa trải nghiệm người dùng.
D. Tối ưu hóa hoạt động sản xuất và chuỗi cung ứng.
2. Thách thức về 'skill gap′ (khoảng cách kỹ năng) trong Big Data đề cập đến vấn đề gì?
A. Thiếu hụt công nghệ và công cụ Big Data.
B. Thiếu hụt nhân lực có đủ kỹ năng và kinh nghiệm để làm việc với Big Data.
C. Chi phí đầu tư cho đào tạo kỹ năng Big Data quá cao.
D. Khó khăn trong việc tiếp cận dữ liệu lớn.
3. Spark khác biệt chính so với MapReduce của Hadoop ở điểm nào?
A. Spark chỉ có thể xử lý dữ liệu có cấu trúc.
B. Spark xử lý dữ liệu nhanh hơn nhờ cơ chế in-memory processing.
C. Spark không thể xử lý dữ liệu phi cấu trúc.
D. Spark không hỗ trợ ngôn ngữ lập trình Python.
4. Đặc điểm 'Đa dạng′ (Variety) trong Big Data thể hiện điều gì?
A. Số lượng nguồn dữ liệu khác nhau.
B. Các loại dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc.
C. Tốc độ thay đổi của dữ liệu theo thời gian.
D. Giá trị kinh tế tiềm ẩn trong dữ liệu.
5. Đặc điểm 'Khối lượng lớn′ (Volume) trong Big Data đề cập đến yếu tố nào?
A. Tốc độ xử lý dữ liệu cực nhanh.
B. Sự đa dạng của các loại dữ liệu khác nhau.
C. Dung lượng dữ liệu khổng lồ cần được lưu trữ và xử lý.
D. Tính xác thực và đáng tin cậy của dữ liệu.
6. Công cụ trực quan hóa dữ liệu (Data Visualization) giúp ích gì trong Big Data Analytics?
A. Tăng tốc độ xử lý dữ liệu.
B. Biến dữ liệu phức tạp thành hình ảnh dễ hiểu, giúp nhận diện xu hướng và thông tin.
C. Bảo mật dữ liệu tốt hơn.
D. Giảm dung lượng lưu trữ dữ liệu.
7. Đặc điểm 'Tính xác thực′ (Veracity) của Big Data ám chỉ yếu tố nào?
A. Khả năng dữ liệu được truy cập nhanh chóng.
B. Mức độ tin cậy và chính xác của dữ liệu.
C. Dung lượng lưu trữ dữ liệu.
D. Sự đa dạng về nguồn gốc dữ liệu.
8. Data Mining (Khai phá dữ liệu) trong Big Data được sử dụng để làm gì?
A. Lưu trữ dữ liệu hiệu quả.
B. Tìm kiếm các mẫu, xu hướng và thông tin ẩn sâu trong dữ liệu.
C. Bảo mật dữ liệu khỏi truy cập trái phép.
D. Truyền tải dữ liệu nhanh chóng.
9. Cơ sở dữ liệu nào sau đây là một ví dụ về NoSQL database?
A. MySQL
B. PostgreSQL
C. MongoDB
D. Oracle Database
10. Edge Computing (Điện toán biên) có lợi ích gì trong bối cảnh Big Data?
A. Tăng cường bảo mật dữ liệu trung tâm.
B. Giảm độ trễ và băng thông mạng bằng cách xử lý dữ liệu gần nguồn phát sinh.
C. Tăng dung lượng lưu trữ dữ liệu.
D. Đơn giản hóa việc phân tích dữ liệu phức tạp.
11. Công nghệ nào sau đây KHÔNG phải là thành phần cốt lõi trong hệ sinh thái Hadoop?
A. HDFS (Hadoop Distributed File System)
B. MapReduce
C. Spark
D. SQL Server
12. Đặc điểm 'Tốc độ' (Velocity) của Big Data liên quan mật thiết đến điều gì?
A. Sự phức tạp của cấu trúc dữ liệu.
B. Tần suất dữ liệu được tạo ra và tốc độ cần xử lý dữ liệu.
C. Độ chính xác và tin cậy của nguồn dữ liệu.
D. Khả năng mở rộng của hệ thống lưu trữ dữ liệu.
13. Khái niệm 'Data Scientist′ (Nhà khoa học dữ liệu) trong lĩnh vực Big Data mô tả vai trò nào?
A. Chuyên gia về phần cứng máy tính.
B. Chuyên gia về bảo mật mạng.
C. Chuyên gia phân tích dữ liệu, sử dụng kỹ năng thống kê, lập trình và kiến thức chuyên môn để khai thác thông tin từ Big Data.
D. Chuyên gia về thiết kế giao diện người dùng.
14. Data Governance (Quản trị dữ liệu) trong Big Data hướng đến mục tiêu chính nào?
A. Tăng tốc độ xử lý dữ liệu.
B. Đảm bảo chất lượng, bảo mật, tuân thủ và quản lý vòng đời dữ liệu hiệu quả.
C. Giảm chi phí lưu trữ dữ liệu.
D. Đơn giản hóa việc thu thập dữ liệu.
15. Trong lĩnh vực Y tế, Big Data có thể được ứng dụng để làm gì?
A. Tạo ra thuốc mới nhanh hơn.
B. Cá nhân hóa phác đồ điều trị cho bệnh nhân.
C. Thay thế hoàn toàn bác sĩ.
D. Giảm chi phí xây dựng bệnh viện.
16. Machine Learning (Học máy) đóng vai trò gì trong ứng dụng Big Data?
A. Thay thế hoàn toàn con người trong việc phân tích dữ liệu.
B. Tự động hóa quá trình phân tích và dự đoán dựa trên dữ liệu.
C. Giảm thiểu dung lượng lưu trữ dữ liệu.
D. Tăng tốc độ thu thập dữ liệu.
17. Trong mô hình 5V của Big Data, chữ 'Value′ (Giá trị) thể hiện điều gì?
A. Giá trị của dữ liệu được tạo ra theo thời gian thực.
B. Giá trị kinh tế và lợi ích kinh doanh mà dữ liệu lớn mang lại.
C. Giá trị của các công cụ và công nghệ xử lý Big Data.
D. Giá trị của việc bảo mật dữ liệu lớn.
18. Real-time analytics (Phân tích thời gian thực) trong Big Data có ý nghĩa gì?
A. Phân tích dữ liệu lịch sử để dự đoán tương lai.
B. Phân tích dữ liệu ngay khi nó được tạo ra để đưa ra quyết định tức thời.
C. Phân tích dữ liệu theo lô định kỳ.
D. Phân tích dữ liệu sau khi đã lưu trữ một thời gian dài.
19. Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop bằng ngôn ngữ SQL?
A. HBase
B. Hive
C. Pig
D. ZooKeeper
20. Data Lake (Hồ dữ liệu) khác biệt chính so với Data Warehouse (Kho dữ liệu) ở điểm nào?
A. Data Lake chỉ lưu trữ dữ liệu có cấu trúc.
B. Data Lake lưu trữ dữ liệu thô ở định dạng gốc, còn Data Warehouse lưu trữ dữ liệu đã qua xử lý và chuẩn hóa.
C. Data Lake không thể truy vấn dữ liệu bằng SQL.
D. Data Lake có dung lượng lưu trữ nhỏ hơn Data Warehouse.
21. Vấn đề đạo đức nào sau đây thường được đặt ra khi sử dụng Big Data?
A. Chi phí đầu tư công nghệ Big Data quá cao.
B. Nguy cơ xâm phạm quyền riêng tư cá nhân khi thu thập và phân tích dữ liệu.
C. Khó khăn trong việc tìm kiếm nhân lực có kỹ năng Big Data.
D. Tốc độ xử lý dữ liệu quá chậm.
22. Cloud Computing (Điện toán đám mây) đóng vai trò quan trọng như thế nào đối với Big Data?
A. Giảm chi phí phần cứng cho Big Data infrastructure.
B. Cung cấp khả năng mở rộng linh hoạt và tài nguyên tính toán lớn cho Big Data.
C. Đơn giản hóa việc quản lý dữ liệu.
D. Tất cả các đáp án trên.
23. Thách thức lớn nhất liên quan đến bảo mật dữ liệu trong Big Data là gì?
A. Dung lượng dữ liệu quá lớn.
B. Sự đa dạng của nguồn dữ liệu.
C. Nguy cơ rò rỉ và tấn công mạng vào lượng lớn dữ liệu tập trung.
D. Tốc độ xử lý dữ liệu quá nhanh.
24. ETL (Extract, Transform, Load) là quy trình quan trọng trong Big Data, giai đoạn 'Transform′ (Biến đổi) bao gồm công việc nào?
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Làm sạch, chuẩn hóa và chuyển đổi dữ liệu sang định dạng phù hợp.
C. Lưu trữ dữ liệu vào kho dữ liệu.
D. Phân tích và trực quan hóa dữ liệu.
25. HDFS (Hadoop Distributed File System) được sử dụng cho mục đích chính nào trong Big Data?
A. Xử lý dữ liệu theo thời gian thực.
B. Lưu trữ dữ liệu phân tán trên nhiều máy tính.
C. Truy vấn dữ liệu bằng ngôn ngữ SQL.
D. Trực quan hóa dữ liệu.
26. NoSQL database (Cơ sở dữ liệu NoSQL) được thiết kế để giải quyết thách thức chính nào của Big Data?
A. Bảo mật dữ liệu.
B. Xử lý dữ liệu phi cấu trúc và khả năng mở rộng.
C. Truy vấn dữ liệu phức tạp.
D. Chuẩn hóa dữ liệu.
27. Trong ngành bán lẻ, Big Data giúp ích như thế nào?
A. Giảm giá thành sản phẩm.
B. Dự đoán nhu cầu hàng hóa và tối ưu hóa tồn kho.
C. Tăng số lượng nhân viên bán hàng.
D. Xây dựng cửa hàng lớn hơn.
28. MapReduce trong Hadoop hoạt động theo mô hình lập trình nào?
A. Mô hình hướng đối tượng.
B. Mô hình song song phân tán.
C. Mô hình tuần tự.
D. Mô hình sự kiện.
29. Xu hướng 'Data Fabric′ (Mô hình dữ liệu dạng vải) trong Big Data hướng đến điều gì?
A. Tăng cường bảo mật dữ liệu.
B. Tạo ra một lớp trừu tượng hóa dữ liệu, giúp truy cập và quản lý dữ liệu phân tán dễ dàng hơn.
C. Giảm chi phí lưu trữ dữ liệu.
D. Tăng tốc độ xử lý dữ liệu thời gian thực.
30. Trong tương lai, Big Data dự kiến sẽ phát triển theo hướng nào?
A. Giảm tầm quan trọng do sự xuất hiện của AI.
B. Tích hợp sâu hơn với AI, IoT và Cloud Computing, hướng tới phân tích thông minh và tự động hóa cao hơn.
C. Chỉ tập trung vào dữ liệu có cấu trúc.
D. Giảm dung lượng dữ liệu.