Đề 6 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 6 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Đặc tính 'Variety′ (Đa dạng) của Big Data thể hiện ở khía cạnh nào?

A. Số lượng nguồn dữ liệu.
B. Sự phức tạp của thuật toán xử lý.
C. Các loại dữ liệu khác nhau như có cấu trúc, bán cấu trúc và phi cấu trúc.
D. Khả năng mở rộng của hệ thống lưu trữ.

2. Để đảm bảo 'Veracity′ (Tính xác thực) của Big Data, biện pháp nào sau đây quan trọng nhất?

A. Tăng cường dung lượng lưu trữ.
B. Triển khai quy trình kiểm soát chất lượng dữ liệu và làm sạch dữ liệu.
C. Tăng tốc độ xử lý dữ liệu.
D. Sử dụng công nghệ trực quan hóa dữ liệu.

3. Ứng dụng Machine Learning trong Big Data giúp cải thiện khả năng 'Predictive Analytics′ (Phân tích dự đoán) như thế nào?

A. Tăng tốc độ xử lý dữ liệu hiện tại.
B. Xây dựng mô hình dự đoán dựa trên dữ liệu lịch sử và các mẫu đã học.
C. Cải thiện chất lượng dữ liệu đầu vào.
D. Trực quan hóa dữ liệu dự đoán.

4. Đặc điểm 'Volume′ (Dung lượng) trong Big Data đề cập đến yếu tố nào?

A. Sự đa dạng của các loại dữ liệu.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Khối lượng dữ liệu khổng lồ được tạo ra.
D. Tính xác thực và đáng tin cậy của dữ liệu.

5. Công nghệ NoSQL thường được sử dụng trong Big Data để giải quyết vấn đề gì?

A. Xử lý giao dịch trực tuyến.
B. Quản lý dữ liệu có cấu trúc.
C. Quản lý dữ liệu phi cấu trúc và bán cấu trúc với khả năng mở rộng cao.
D. Bảo mật dữ liệu quan hệ.

6. Ưu điểm của việc sử dụng điện toán đám mây (Cloud Computing) trong Big Data là gì?

A. Giảm độ trễ mạng.
B. Khả năng mở rộng linh hoạt, chi phí hiệu quả và dễ dàng truy cập tài nguyên.
C. Tăng cường bảo mật dữ liệu tại chỗ.
D. Đơn giản hóa việc quản lý phần cứng vật lý.

7. So sánh Data Lake và Data Warehouse, phát biểu nào sau đây đúng về Data Lake?

A. Thường được sử dụng cho mục đích báo cáo và phân tích có cấu trúc.
B. Lưu trữ dữ liệu đã qua xử lý và có cấu trúc rõ ràng.
C. Linh hoạt hơn trong việc lưu trữ nhiều loại dữ liệu khác nhau, bao gồm cả dữ liệu thô và chưa cấu trúc.
D. Yêu cầu mô hình dữ liệu được xác định trước khi lưu trữ.

8. Thuật ngữ 'Velocity′ (Tốc độ) trong Big Data ám chỉ điều gì?

A. Độ chính xác của dữ liệu.
B. Thời gian lưu trữ dữ liệu.
C. Tốc độ dữ liệu được tạo ra và cần xử lý nhanh chóng.
D. Giá trị kinh tế của dữ liệu.

9. Ứng dụng Big Data phổ biến trong lĩnh vực thương mại điện tử là gì?

A. Quản lý chuỗi cung ứng.
B. Dự báo thời tiết.
C. Cá nhân hóa trải nghiệm khách hàng và đề xuất sản phẩm.
D. Nghiên cứu y học.

10. Thách thức 'Volume′ (Dung lượng) của Big Data ảnh hưởng đến việc lựa chọn công nghệ lưu trữ như thế nào?

A. Yêu cầu công nghệ lưu trữ có khả năng nén dữ liệu cao.
B. Đòi hỏi hệ thống lưu trữ phân tán, có khả năng mở rộng lớn và chi phí hiệu quả.
C. Tăng cường sử dụng bộ nhớ đệm (cache) để truy cập nhanh hơn.
D. Ưu tiên sử dụng ổ cứng SSD thay vì HDD.

11. Data Mining (Khai thác dữ liệu) đóng vai trò gì trong Big Data?

A. Thu thập dữ liệu từ nhiều nguồn.
B. Lưu trữ dữ liệu hiệu quả.
C. Tìm kiếm các mẫu, xu hướng ẩn và tri thức có giá trị từ dữ liệu lớn.
D. Bảo vệ dữ liệu khỏi truy cập trái phép.

12. Trong quy trình ETL, giai đoạn 'Extract′ (Trích xuất) thường bao gồm công việc nào?

A. Làm sạch và chuẩn hóa dữ liệu.
B. Xác định nguồn dữ liệu và thu thập dữ liệu từ các nguồn đó.
C. Chuyển đổi dữ liệu sang định dạng phù hợp.
D. Lưu trữ dữ liệu đã xử lý vào hệ thống báo cáo.

13. Một trong những thách thức về bảo mật dữ liệu lớn (Big Data) là gì?

A. Tốc độ truy cập dữ liệu chậm.
B. Sự đa dạng của nguồn dữ liệu làm tăng nguy cơ rò rỉ và tấn công.
C. Chi phí lưu trữ dữ liệu cao.
D. Thiếu nhân lực có kỹ năng phân tích dữ liệu.

14. Hadoop là một framework mã nguồn mở phổ biến trong Big Data, chủ yếu được dùng để làm gì?

A. Trực quan hóa dữ liệu.
B. Lưu trữ và xử lý phân tán dữ liệu lớn.
C. Bảo mật dữ liệu.
D. Kết nối mạng.

15. ETL (Extract, Transform, Load) là quy trình quan trọng trong Big Data, giai đoạn 'Transform′ (Biến đổi) bao gồm công việc gì?

A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Làm sạch, chuẩn hóa, và chuyển đổi dữ liệu sang định dạng phù hợp.
C. Lưu trữ dữ liệu vào hệ thống đích.
D. Phân tích dữ liệu.

16. Ứng dụng của Big Data trong lĩnh vực y tế giúp ích gì?

A. Giảm chi phí quảng cáo thuốc.
B. Cải thiện chẩn đoán bệnh, phát triển thuốc mới và y tế cá nhân hóa.
C. Tăng cường bảo mật thông tin bệnh nhân.
D. Tự động hóa quy trình hành chính bệnh viện.

17. Giá trị (Value) của Big Data được tạo ra khi nào?

A. Khi dữ liệu được thu thập với số lượng lớn.
B. Khi dữ liệu được xử lý với tốc độ cao.
C. Khi dữ liệu được phân tích và chuyển thành thông tin hữu ích, mang lại lợi ích.
D. Khi dữ liệu được lưu trữ một cách an toàn.

18. Yếu tố 'Veracity′ (Tính xác thực) trong Big Data quan trọng vì điều gì?

A. Đảm bảo tốc độ xử lý dữ liệu.
B. Xác định giá trị kinh doanh của dữ liệu.
C. Đảm bảo chất lượng và độ tin cậy của dữ liệu để đưa ra quyết định chính xác.
D. Tối ưu hóa không gian lưu trữ dữ liệu.

19. Việc phân tích Big Data mang lại 'Value′ (Giá trị) cho doanh nghiệp bằng cách nào?

A. Giảm chi phí nhân công.
B. Cung cấp thông tin chi tiết để đưa ra quyết định kinh doanh tốt hơn, tối ưu hóa hoạt động và tạo ra doanh thu mới.
C. Tăng cường bảo mật thông tin nội bộ.
D. Cải thiện hệ thống mạng.

20. Data Warehouse (Kho dữ liệu) khác biệt với Data Lake (Hồ dữ liệu) như thế nào trong bối cảnh Big Data?

A. Data Warehouse lưu trữ dữ liệu phi cấu trúc, Data Lake lưu trữ dữ liệu có cấu trúc.
B. Data Warehouse xử lý dữ liệu thời gian thực, Data Lake xử lý dữ liệu lịch sử.
C. Data Warehouse lưu trữ dữ liệu đã được xử lý và cấu trúc hóa, Data Lake lưu trữ dữ liệu thô ở định dạng gốc.
D. Data Warehouse có khả năng mở rộng tốt hơn Data Lake.

21. Trong quy trình Data Mining, kỹ thuật 'Clustering′ (Phân cụm) thường được sử dụng để làm gì?

A. Dự đoán giá trị tương lai.
B. Phân loại dữ liệu vào các nhóm dựa trên sự tương đồng.
C. Tìm kiếm mối quan hệ nhân quả.
D. Phát hiện ngoại lệ.

22. Khi nói về 'Velocity′ (Tốc độ) trong Big Data, 'streaming data′ (dữ liệu dòng) là gì?

A. Dữ liệu được lưu trữ trong Data Lake.
B. Dữ liệu được tạo ra liên tục và cần xử lý gần như tức thời.
C. Dữ liệu đã được làm sạch và chuẩn hóa.
D. Dữ liệu được truy cập ngẫu nhiên.

23. Machine Learning (Học máy) được ứng dụng trong Big Data để làm gì?

A. Trực quan hóa dữ liệu.
B. Tự động hóa quá trình phân tích dữ liệu và đưa ra dự đoán.
C. Đảm bảo chất lượng dữ liệu.
D. Tăng tốc độ truyền dữ liệu.

24. Ví dụ nào sau đây thể hiện rõ nhất đặc tính 'Variety′ (Đa dạng) của Big Data?

A. Một công ty có hàng triệu khách hàng.
B. Dữ liệu bao gồm văn bản, hình ảnh, video và dữ liệu cảm biến.
C. Dữ liệu được tạo ra với tốc độ gigabyte mỗi giây.
D. Dữ liệu được thu thập từ nhiều quốc gia khác nhau.

25. Trong kiến trúc Lambda của Big Data, 'Batch Layer′ (Lớp xử lý hàng loạt) được sử dụng để làm gì?

A. Xử lý dữ liệu thời gian thực.
B. Phục vụ các truy vấn tương tác.
C. Xử lý toàn bộ tập dữ liệu lịch sử một cách định kỳ.
D. Lưu trữ dữ liệu tạm thời.

26. Kiến trúc Kappa của Big Data đơn giản hóa kiến trúc Lambda bằng cách nào?

A. Loại bỏ lớp xử lý thời gian thực.
B. Kết hợp lớp xử lý hàng loạt và lớp tốc độ thành một lớp duy nhất.
C. Sử dụng cơ sở dữ liệu NoSQL thay vì cơ sở dữ liệu quan hệ.
D. Tập trung vào xử lý dữ liệu phi cấu trúc.

27. Trong lĩnh vực tài chính, Big Data được sử dụng để phát hiện gian lận như thế nào?

A. Tăng cường tốc độ giao dịch.
B. Phân tích hành vi giao dịch bất thường và các mẫu gian lận tiềm ẩn.
C. Giảm thiểu rủi ro thị trường.
D. Cải thiện dịch vụ khách hàng.

28. Spark là một công cụ xử lý Big Data nổi bật, ưu điểm chính của Spark so với Hadoop MapReduce là gì?

A. Khả năng lưu trữ dữ liệu lớn hơn.
B. Tốc độ xử lý nhanh hơn nhờ xử lý dữ liệu trong bộ nhớ.
C. Chi phí triển khai thấp hơn.
D. Dễ dàng tích hợp với các hệ thống cũ hơn.

29. Thách thức lớn nhất khi làm việc với Big Data thường liên quan đến yếu tố nào?

A. Sự thiếu hụt công nghệ lưu trữ.
B. Đảm bảo tính bảo mật của dữ liệu.
C. Khả năng xử lý, phân tích và trích xuất giá trị từ khối lượng dữ liệu khổng lồ và phức tạp.
D. Chi phí đầu tư ban đầu cho hạ tầng.

30. Data Governance (Quản trị dữ liệu) trong Big Data nhằm mục đích gì?

A. Tăng tốc độ xử lý dữ liệu.
B. Đảm bảo chất lượng, bảo mật, tuân thủ quy định và quản lý dữ liệu hiệu quả trong tổ chức.
C. Giảm chi phí lưu trữ dữ liệu.
D. Cải thiện giao diện người dùng.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

1. Đặc tính `Variety′ (Đa dạng) của Big Data thể hiện ở khía cạnh nào?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

2. Để đảm bảo `Veracity′ (Tính xác thực) của Big Data, biện pháp nào sau đây quan trọng nhất?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

3. Ứng dụng Machine Learning trong Big Data giúp cải thiện khả năng `Predictive Analytics′ (Phân tích dự đoán) như thế nào?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

4. Đặc điểm `Volume′ (Dung lượng) trong Big Data đề cập đến yếu tố nào?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

5. Công nghệ NoSQL thường được sử dụng trong Big Data để giải quyết vấn đề gì?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

6. Ưu điểm của việc sử dụng điện toán đám mây (Cloud Computing) trong Big Data là gì?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

7. So sánh Data Lake và Data Warehouse, phát biểu nào sau đây đúng về Data Lake?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

8. Thuật ngữ `Velocity′ (Tốc độ) trong Big Data ám chỉ điều gì?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

9. Ứng dụng Big Data phổ biến trong lĩnh vực thương mại điện tử là gì?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

10. Thách thức `Volume′ (Dung lượng) của Big Data ảnh hưởng đến việc lựa chọn công nghệ lưu trữ như thế nào?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

11. Data Mining (Khai thác dữ liệu) đóng vai trò gì trong Big Data?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

12. Trong quy trình ETL, giai đoạn `Extract′ (Trích xuất) thường bao gồm công việc nào?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

13. Một trong những thách thức về bảo mật dữ liệu lớn (Big Data) là gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

14. Hadoop là một framework mã nguồn mở phổ biến trong Big Data, chủ yếu được dùng để làm gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

15. ETL (Extract, Transform, Load) là quy trình quan trọng trong Big Data, giai đoạn `Transform′ (Biến đổi) bao gồm công việc gì?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

16. Ứng dụng của Big Data trong lĩnh vực y tế giúp ích gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

17. Giá trị (Value) của Big Data được tạo ra khi nào?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

18. Yếu tố `Veracity′ (Tính xác thực) trong Big Data quan trọng vì điều gì?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

19. Việc phân tích Big Data mang lại `Value′ (Giá trị) cho doanh nghiệp bằng cách nào?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

20. Data Warehouse (Kho dữ liệu) khác biệt với Data Lake (Hồ dữ liệu) như thế nào trong bối cảnh Big Data?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

21. Trong quy trình Data Mining, kỹ thuật `Clustering′ (Phân cụm) thường được sử dụng để làm gì?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

22. Khi nói về `Velocity′ (Tốc độ) trong Big Data, `streaming data′ (dữ liệu dòng) là gì?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

23. Machine Learning (Học máy) được ứng dụng trong Big Data để làm gì?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

24. Ví dụ nào sau đây thể hiện rõ nhất đặc tính `Variety′ (Đa dạng) của Big Data?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

25. Trong kiến trúc Lambda của Big Data, `Batch Layer′ (Lớp xử lý hàng loạt) được sử dụng để làm gì?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

26. Kiến trúc Kappa của Big Data đơn giản hóa kiến trúc Lambda bằng cách nào?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

27. Trong lĩnh vực tài chính, Big Data được sử dụng để phát hiện gian lận như thế nào?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

28. Spark là một công cụ xử lý Big Data nổi bật, ưu điểm chính của Spark so với Hadoop MapReduce là gì?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

29. Thách thức lớn nhất khi làm việc với Big Data thường liên quan đến yếu tố nào?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 7

30. Data Governance (Quản trị dữ liệu) trong Big Data nhằm mục đích gì?