1. Khi nói về 'Velocity′ (Tốc độ) của Dữ liệu lớn, chúng ta thường quan tâm đến yếu tố nào?
A. Kích thước tổng thể của dữ liệu
B. Tốc độ dữ liệu được tạo ra và cần được xử lý
C. Độ chính xác của dữ liệu
D. Sự đa dạng của các loại dữ liệu
2. Trong lĩnh vực tài chính ngân hàng, Dữ liệu lớn được sử dụng để cải thiện điều gì?
A. Thiết kế lại chi nhánh ngân hàng
B. Đánh giá rủi ro tín dụng và phát hiện gian lận
C. In tiền giấy
D. Xây dựng trụ sở ngân hàng mới
3. Trong quy trình phân tích Dữ liệu lớn, bước nào thường diễn ra SAU khi thu thập và lưu trữ dữ liệu?
A. Trực quan hóa dữ liệu
B. Làm sạch và chuẩn hóa dữ liệu
C. Thu thập dữ liệu
D. Bảo mật dữ liệu
4. Yếu tố 'Variety′ (Đa dạng) của Dữ liệu lớn bao gồm những loại dữ liệu nào?
A. Chỉ dữ liệu văn bản và số
B. Dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc
C. Chỉ dữ liệu từ mạng xã hội
D. Dữ liệu giao dịch và dữ liệu nhật ký
5. Trong bối cảnh Dữ liệu lớn, 'Data Lake′ (Hồ dữ liệu) khác biệt với 'Data Warehouse′ (Kho dữ liệu) chủ yếu ở điểm nào?
A. Data Lake chỉ lưu trữ dữ liệu có cấu trúc
B. Data Lake lưu trữ dữ liệu ở định dạng thô, chưa qua xử lý
C. Data Warehouse linh hoạt hơn Data Lake
D. Data Warehouse được xây dựng để xử lý dữ liệu thời gian thực
6. Khái niệm 'Data Mining′ (Khai phá dữ liệu) liên quan đến Dữ liệu lớn như thế nào?
A. Khai phá dữ liệu là một phương pháp lưu trữ Dữ liệu lớn
B. Khai phá dữ liệu là quá trình thu thập Dữ liệu lớn
C. Khai phá dữ liệu là kỹ thuật phân tích Dữ liệu lớn để tìm ra tri thức hữu ích
D. Khai phá dữ liệu là cách bảo mật Dữ liệu lớn
7. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Dữ liệu lớn?
A. Cá nhân hóa trải nghiệm khách hàng trong thương mại điện tử
B. Dự báo thời tiết
C. Quản lý kho hàng quy mô nhỏ cho cửa hàng tạp hóa
D. Phát hiện gian lận trong lĩnh vực tài chính
8. Thuật ngữ 'Hadoop′ liên quan đến khía cạnh nào của Dữ liệu lớn?
A. Trực quan hóa dữ liệu
B. Lưu trữ và xử lý dữ liệu phân tán
C. Phân tích dự đoán
D. Bảo mật dữ liệu
9. Ưu điểm chính của việc sử dụng điện toán đám mây (Cloud Computing) trong xử lý Dữ liệu lớn là gì?
A. Giảm chi phí phần cứng ban đầu và khả năng mở rộng linh hoạt
B. Tăng cường bảo mật dữ liệu tuyệt đối
C. Đảm bảo tốc độ xử lý nhanh nhất mọi lúc
D. Loại bỏ hoàn toàn nhu cầu về nhân lực IT chuyên môn
10. Trong lĩnh vực y tế, Dữ liệu lớn được ứng dụng để làm gì?
A. Quản lý hồ sơ bệnh án giấy
B. Phân tích hình ảnh chụp X-quang bằng mắt thường
C. Phát triển thuốc mới và chẩn đoán bệnh sớm
D. In toa thuốc thủ công
11. Trong bối cảnh Internet of Things (IoT), Dữ liệu lớn đóng vai trò gì?
A. Giảm số lượng thiết bị IoT kết nối
B. Xử lý và phân tích dữ liệu từ vô số thiết bị IoT
C. Thay thế hoàn toàn các thiết bị IoT
D. Giới hạn khả năng kết nối của thiết bị IoT
12. Loại dữ liệu nào sau đây thường KHÔNG được coi là Dữ liệu lớn?
A. Nhật ký máy chủ web
B. Dữ liệu giao dịch thẻ tín dụng
C. Bảng tính Excel chứa 100 dòng dữ liệu
D. Bài đăng trên mạng xã hội
13. Trong ngữ cảnh Dữ liệu lớn, 'Real-time processing′ (Xử lý thời gian thực) có nghĩa là gì?
A. Xử lý dữ liệu sau khi đã thu thập trong một khoảng thời gian dài
B. Xử lý dữ liệu ngay khi nó được tạo ra hoặc thu thập
C. Xử lý dữ liệu theo lịch trình hàng ngày
D. Xử lý dữ liệu thủ công bởi con người
14. Kỹ thuật 'MapReduce′ trong Hadoop được sử dụng chủ yếu cho mục đích gì?
A. Trực quan hóa dữ liệu
B. Truy vấn dữ liệu thời gian thực
C. Xử lý song song và phân tán dữ liệu
D. Bảo mật dữ liệu trong Hadoop
15. Công nghệ NoSQL thường được sử dụng trong Dữ liệu lớn để giải quyết vấn đề nào?
A. Xử lý giao dịch trực tuyến (OLTP)
B. Quản lý dữ liệu có cấu trúc phức tạp
C. Xử lý dữ liệu phi cấu trúc và bán cấu trúc
D. Đảm bảo tính toàn vẹn dữ liệu ACID
16. Ngôn ngữ lập trình nào thường được sử dụng phổ biến trong phân tích Dữ liệu lớn?
A. Java
B. Python
C. C++
D. Assembly
17. Thách thức về 'Volume′ (Khối lượng) trong Dữ liệu lớn đòi hỏi giải pháp công nghệ nào?
A. Mã hóa dữ liệu
B. Lưu trữ dữ liệu phân tán
C. Trực quan hóa dữ liệu
D. Làm sạch dữ liệu
18. Hạn chế chính của việc chỉ sử dụng cơ sở dữ liệu quan hệ truyền thống (RDBMS) để xử lý Dữ liệu lớn là gì?
A. Khả năng mở rộng kém và khó xử lý dữ liệu phi cấu trúc
B. Chi phí phần mềm quá cao
C. Yêu cầu phần cứng quá mạnh
D. Khó khăn trong việc bảo mật dữ liệu
19. Công cụ nào sau đây thường được sử dụng để trực quan hóa Dữ liệu lớn?
A. Microsoft Excel
B. Tableau
C. Microsoft Word
D. Notepad
20. Yếu tố 'Value′ (Giá trị) trong 5V của Dữ liệu lớn nhấn mạnh điều gì?
A. Khối lượng dữ liệu khổng lồ
B. Tốc độ xử lý dữ liệu nhanh
C. Giá trị kinh doanh và lợi ích mà dữ liệu mang lại
D. Độ tin cậy của nguồn dữ liệu
21. Đặc điểm nào sau đây KHÔNG thuộc về 5V của Dữ liệu lớn?
A. Volume (Khối lượng)
B. Velocity (Tốc độ)
C. Veracity (Độ tin cậy)
D. Visibility (Khả năng hiển thị)
22. Khi triển khai dự án Dữ liệu lớn, thách thức về mặt tổ chức thường gặp phải là gì?
A. Thiếu hụt công nghệ lưu trữ
B. Thiếu nhân lực có kỹ năng phân tích dữ liệu
C. Chi phí phần mềm quá cao
D. Khó khăn trong việc mua phần cứng
23. Trong lĩnh vực marketing, Dữ liệu lớn giúp doanh nghiệp thực hiện điều gì hiệu quả hơn?
A. In tờ rơi quảng cáo hàng loạt
B. Gửi email spam
C. Phân khúc thị trường và cá nhân hóa quảng cáo
D. Tăng giá sản phẩm một cách ngẫu nhiên
24. Loại hình tấn công mạng nào có thể đặc biệt nguy hiểm trong môi trường Dữ liệu lớn do khối lượng dữ liệu nhạy cảm?
A. Tấn công từ chối dịch vụ (DoS)
B. Tấn công SQL Injection
C. Rò rỉ dữ liệu (Data Breach)
D. Tấn công Virus
25. Ứng dụng nào sau đây thể hiện rõ nhất tiềm năng của Dữ liệu lớn trong việc cải thiện chất lượng cuộc sống?
A. Gửi quảng cáo trực tuyến
B. Tối ưu hóa kết quả tìm kiếm trên internet
C. Phát triển hệ thống giao thông thông minh và đô thị thông minh
D. Tăng cường bảo mật tài khoản email cá nhân
26. Thuật ngữ 'Data Science′ (Khoa học dữ liệu) liên quan đến Dữ liệu lớn như thế nào?
A. Data Science là một loại Dữ liệu lớn
B. Data Science là một công cụ lưu trữ Dữ liệu lớn
C. Data Science là lĩnh vực nghiên cứu và ứng dụng các phương pháp phân tích Dữ liệu lớn
D. Data Science là một phần mềm bảo mật Dữ liệu lớn
27. Công nghệ 'Spark′ khác biệt so với 'Hadoop MapReduce′ chủ yếu ở điểm nào?
A. Spark chỉ xử lý dữ liệu có cấu trúc
B. Spark nhanh hơn MapReduce trong xử lý dữ liệu lặp đi lặp lại
C. MapReduce hỗ trợ xử lý thời gian thực tốt hơn Spark
D. Spark chỉ chạy trên hệ thống đám mây
28. Để đảm bảo tính bảo mật cho Dữ liệu lớn, biện pháp nào sau đây KHÔNG phù hợp?
A. Mã hóa dữ liệu khi lưu trữ và truyền tải
B. Sử dụng mật khẩu yếu và chia sẻ cho nhiều người
C. Kiểm soát truy cập dữ liệu nghiêm ngặt
D. Giám sát và phát hiện xâm nhập hệ thống
29. Trong lĩnh vực sản xuất, Dữ liệu lớn có thể giúp tối ưu hóa quy trình nào?
A. Tuyển dụng nhân sự
B. Bảo trì dự đoán thiết bị và quản lý chuỗi cung ứng
C. Thiết kế sản phẩm mới hoàn toàn thủ công
D. In ấn bao bì sản phẩm
30. Thách thức 'Veracity′ (Độ tin cậy) trong Dữ liệu lớn đề cập đến vấn đề gì?
A. Tốc độ tạo ra dữ liệu quá nhanh
B. Sự đa dạng của các nguồn dữ liệu
C. Tính không chắc chắn và không chính xác của dữ liệu
D. Khối lượng dữ liệu quá lớn để xử lý