Đề 2 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 2 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Ưu điểm chính của việc sử dụng 'In-memory processing′ (Xử lý trong bộ nhớ) trong Dữ liệu lớn là gì?

A. Giảm chi phí lưu trữ
B. Tăng tốc độ xử lý dữ liệu đáng kể do giảm thiểu thời gian truy cập đĩa
C. Đơn giản hóa việc quản lý dữ liệu phân tán
D. Tăng cường bảo mật dữ liệu

2. Thuật ngữ 'Data Wrangling′ (Chuẩn bị dữ liệu) trong Dữ liệu lớn bao gồm các công việc chính nào?

A. Lưu trữ và bảo mật dữ liệu
B. Thu thập, làm sạch, chuyển đổi và chuẩn hóa dữ liệu để sẵn sàng cho phân tích
C. Trực quan hóa dữ liệu
D. Xây dựng mô hình học máy

3. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

A. Hadoop HDFS
B. Apache Spark
C. Tableau
D. HiveQL

4. Lợi ích chính của việc sử dụng điện toán đám mây (Cloud Computing) trong Dữ liệu lớn là gì?

A. Giảm chi phí phần cứng và cơ sở hạ tầng, khả năng mở rộng linh hoạt
B. Tăng cường bảo mật dữ liệu tuyệt đối
C. Giảm độ trễ khi truy cập dữ liệu ở xa
D. Đơn giản hóa việc quản lý cơ sở dữ liệu quan hệ

5. Trong ngữ cảnh bảo mật Dữ liệu lớn, 'Data Masking′ (Che giấu dữ liệu) được sử dụng để làm gì?

A. Mã hóa dữ liệu
B. Ẩn hoặc thay thế dữ liệu nhạy cảm bằng dữ liệu giả mạo nhưng vẫn giữ định dạng và tính nhất quán
C. Xóa dữ liệu không cần thiết
D. Kiểm soát truy cập dữ liệu

6. Khái niệm 'Scalability′ (Khả năng mở rộng) trong Dữ liệu lớn có nghĩa là gì?

A. Khả năng xử lý dữ liệu nhanh chóng
B. Khả năng lưu trữ dữ liệu đa dạng
C. Khả năng hệ thống có thể xử lý lượng dữ liệu tăng lên hoặc nhu cầu xử lý tăng lên mà không giảm hiệu suất đáng kể
D. Khả năng dữ liệu dễ dàng được trực quan hóa

7. Phương pháp 'Data Federation′ (Liên kết dữ liệu) trong Dữ liệu lớn có nghĩa là gì?

A. Sao chép dữ liệu từ nhiều nguồn vào một kho tập trung
B. Truy cập và tích hợp dữ liệu từ nhiều nguồn khác nhau mà không cần di chuyển dữ liệu đến một vị trí trung tâm
C. Làm sạch và chuẩn hóa dữ liệu
D. Mã hóa dữ liệu để bảo mật

8. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng điển hình của Dữ liệu lớn?

A. Phân tích hành vi khách hàng trong thương mại điện tử
B. Dự báo thời tiết
C. Quản lý danh sách liên lạc cá nhân trên điện thoại
D. Phát hiện gian lận trong giao dịch tài chính

9. Khái niệm 'Data Silos′ (Kho dữ liệu cô lập) gây ra vấn đề gì trong Dữ liệu lớn?

A. Tăng tốc độ xử lý dữ liệu
B. Cản trở việc tích hợp và phân tích dữ liệu toàn diện, dẫn đến bỏ lỡ thông tin giá trị
C. Nâng cao chất lượng dữ liệu
D. Đơn giản hóa việc quản lý dữ liệu

10. Điểm khác biệt chính giữa 'Data Warehouse′ (Kho dữ liệu) truyền thống và 'Data Lake′ (Hồ dữ liệu) là gì?

A. Data Warehouse lưu trữ dữ liệu thô, còn Data Lake lưu trữ dữ liệu đã được xử lý
B. Data Warehouse thường có cấu trúc dữ liệu định trước (schema-on-write), còn Data Lake cho phép cấu trúc dữ liệu linh hoạt hơn (schema-on-read)
C. Data Warehouse chỉ dùng cho dữ liệu phi cấu trúc, còn Data Lake cho dữ liệu có cấu trúc
D. Data Warehouse nhanh hơn Data Lake trong xử lý dữ liệu

11. Công cụ nào sau đây thường được dùng để truy vấn và phân tích dữ liệu lớn trong Hadoop?

A. Microsoft Word
B. HiveQL
C. Adobe Photoshop
D. PowerPoint

12. Thách thức về 'Volume′ (Khối lượng) trong Dữ liệu lớn chủ yếu liên quan đến vấn đề gì?

A. Tốc độ dữ liệu được tạo ra
B. Đa dạng loại dữ liệu
C. Lượng dữ liệu khổng lồ vượt quá khả năng xử lý của các hệ thống truyền thống
D. Độ tin cậy của dữ liệu

13. Nguyên tắc 'Polyglot Persistence′ trong Dữ liệu lớn khuyến khích điều gì?

A. Sử dụng một loại cơ sở dữ liệu duy nhất cho tất cả các loại dữ liệu
B. Chọn loại cơ sở dữ liệu phù hợp nhất cho từng loại dữ liệu và nhu cầu ứng dụng cụ thể
C. Chỉ sử dụng cơ sở dữ liệu NoSQL
D. Tập trung vào cơ sở dữ liệu quan hệ truyền thống

14. Phương pháp 'Data Mining′ (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu nhằm mục đích gì?

A. Lưu trữ dữ liệu hiệu quả
B. Tìm kiếm các mẫu, xu hướng và thông tin hữu ích ẩn sâu trong dữ liệu
C. Trực quan hóa dữ liệu
D. Đảm bảo tính bảo mật dữ liệu

15. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn theo thời gian thực (real-time processing)?

A. Hadoop MapReduce
B. Apache Spark Streaming
C. Batch processing
D. ETL truyền thống

16. Thách thức 'Veracity′ (Tính xác thực) trong Dữ liệu lớn liên quan đến vấn đề gì?

A. Tốc độ tạo ra dữ liệu quá nhanh
B. Sự đa dạng của các nguồn dữ liệu
C. Độ tin cậy và chất lượng của dữ liệu
D. Khối lượng dữ liệu quá lớn để xử lý

17. Trong lĩnh vực Dữ liệu lớn, 'Data Governance′ (Quản trị dữ liệu) tập trung vào điều gì?

A. Tăng tốc độ xử lý dữ liệu
B. Đảm bảo chất lượng, bảo mật, tuân thủ và quản lý vòng đời dữ liệu
C. Trực quan hóa dữ liệu một cách hiệu quả
D. Phát triển các thuật toán khai phá dữ liệu mới

18. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs′ thường được dùng để mô tả Dữ liệu lớn?

A. Volume (Khối lượng)
B. Velocity (Tốc độ)
C. Value (Giá trị)
D. Validity (Tính hợp lệ)

19. Hệ thống nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn phân tán?

A. Microsoft Excel
B. Hadoop HDFS
C. MySQL
D. Microsoft Access

20. Trong ngữ cảnh Dữ liệu lớn, 'Real-time Analytics′ (Phân tích thời gian thực) mang lại lợi ích gì?

A. Giảm chi phí lưu trữ dữ liệu
B. Cho phép đưa ra quyết định và hành động ngay lập tức dựa trên dữ liệu mới nhất
C. Tăng độ chính xác của phân tích thống kê
D. Đơn giản hóa việc thu thập dữ liệu

21. Trong kiến trúc Dữ liệu lớn, 'Message Queue′ (Hàng đợi tin nhắn) thường được dùng để làm gì?

A. Lưu trữ dữ liệu lâu dài
B. Truyền tải dữ liệu giữa các thành phần hệ thống một cách không đồng bộ và tin cậy
C. Trực quan hóa dữ liệu
D. Xử lý dữ liệu theo lô

22. Trong bối cảnh Dữ liệu lớn, 'ETL′ (Extract, Transform, Load) thường được thay thế bằng quy trình nào linh hoạt hơn?

A. ELT (Extract, Load, Transform)
B. Data Mining
C. Data Visualization
D. Data Governance

23. Kiến trúc 'Lambda Architecture′ trong Dữ liệu lớn được thiết kế để xử lý loại hình phân tích nào?

A. Chỉ phân tích theo lô (batch processing)
B. Chỉ phân tích thời gian thực (real-time processing)
C. Kết hợp cả phân tích theo lô và phân tích thời gian thực
D. Chỉ phân tích dữ liệu có cấu trúc

24. Phương pháp 'Data Sampling′ (Lấy mẫu dữ liệu) được sử dụng trong Dữ liệu lớn khi nào?

A. Khi cần xử lý toàn bộ dữ liệu
B. Khi dữ liệu quá lớn để xử lý toàn bộ hoặc cần phân tích nhanh trên một tập dữ liệu đại diện
C. Khi dữ liệu có chất lượng kém
D. Khi cần trực quan hóa dữ liệu

25. Trong phân tích Dữ liệu lớn, 'Machine Learning′ (Học máy) được sử dụng để làm gì?

A. Lưu trữ dữ liệu lớn
B. Trực quan hóa dữ liệu
C. Phân tích dữ liệu tự động, dự đoán, và phát hiện mẫu
D. Đảm bảo bảo mật dữ liệu

26. Loại dữ liệu nào sau đây KHÔNG thuộc 'Variety′ (Tính đa dạng) trong đặc điểm của Dữ liệu lớn?

A. Văn bản (Text)
B. Hình ảnh (Images)
C. Video
D. Dữ liệu có cấu trúc từ bảng cơ sở dữ liệu quan hệ

27. Yếu tố nào sau đây KHÔNG phải là một thách thức lớn đối với Dữ liệu lớn?

A. Khối lượng dữ liệu khổng lồ
B. Tốc độ dữ liệu tăng nhanh
C. Chi phí phần cứng giảm liên tục
D. Đảm bảo chất lượng và tính xác thực của dữ liệu

28. Thuật ngữ 'Data Lake′ (Hồ dữ liệu) trong Dữ liệu lớn dùng để chỉ điều gì?

A. Một loại cơ sở dữ liệu quan hệ truyền thống
B. Một kho lưu trữ tập trung cho dữ liệu thô, có thể có cấu trúc, bán cấu trúc hoặc phi cấu trúc
C. Một phương pháp trực quan hóa dữ liệu lớn
D. Một công cụ để làm sạch dữ liệu

29. Công nghệ NoSQL thường được sử dụng trong Dữ liệu lớn để giải quyết vấn đề gì?

A. Xử lý giao dịch trực tuyến (OLTP)
B. Quản lý dữ liệu có cấu trúc chặt chẽ
C. Xử lý dữ liệu phi cấu trúc và bán cấu trúc với khả năng mở rộng cao
D. Thay thế hoàn toàn cơ sở dữ liệu quan hệ

30. Công cụ nào sau đây KHÔNG phải là một nền tảng phân tích Dữ liệu lớn phổ biến trên đám mây?

A. Amazon EMR
B. Google Cloud Dataproc
C. Microsoft Azure HDInsight
D. Microsoft PowerPoint

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

1. Ưu điểm chính của việc sử dụng `In-memory processing′ (Xử lý trong bộ nhớ) trong Dữ liệu lớn là gì?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

2. Thuật ngữ `Data Wrangling′ (Chuẩn bị dữ liệu) trong Dữ liệu lớn bao gồm các công việc chính nào?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

3. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

4. Lợi ích chính của việc sử dụng điện toán đám mây (Cloud Computing) trong Dữ liệu lớn là gì?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

5. Trong ngữ cảnh bảo mật Dữ liệu lớn, `Data Masking′ (Che giấu dữ liệu) được sử dụng để làm gì?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

6. Khái niệm `Scalability′ (Khả năng mở rộng) trong Dữ liệu lớn có nghĩa là gì?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

7. Phương pháp `Data Federation′ (Liên kết dữ liệu) trong Dữ liệu lớn có nghĩa là gì?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

8. Ứng dụng nào sau đây KHÔNG phải là một ứng dụng điển hình của Dữ liệu lớn?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

9. Khái niệm `Data Silos′ (Kho dữ liệu cô lập) gây ra vấn đề gì trong Dữ liệu lớn?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

10. Điểm khác biệt chính giữa `Data Warehouse′ (Kho dữ liệu) truyền thống và `Data Lake′ (Hồ dữ liệu) là gì?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

11. Công cụ nào sau đây thường được dùng để truy vấn và phân tích dữ liệu lớn trong Hadoop?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

12. Thách thức về `Volume′ (Khối lượng) trong Dữ liệu lớn chủ yếu liên quan đến vấn đề gì?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

13. Nguyên tắc `Polyglot Persistence′ trong Dữ liệu lớn khuyến khích điều gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

14. Phương pháp `Data Mining′ (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu nhằm mục đích gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

15. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn theo thời gian thực (real-time processing)?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

16. Thách thức `Veracity′ (Tính xác thực) trong Dữ liệu lớn liên quan đến vấn đề gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

17. Trong lĩnh vực Dữ liệu lớn, `Data Governance′ (Quản trị dữ liệu) tập trung vào điều gì?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

18. Đặc điểm nào sau đây KHÔNG phải là một trong `5Vs′ thường được dùng để mô tả Dữ liệu lớn?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

19. Hệ thống nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn phân tán?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

20. Trong ngữ cảnh Dữ liệu lớn, `Real-time Analytics′ (Phân tích thời gian thực) mang lại lợi ích gì?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

21. Trong kiến trúc Dữ liệu lớn, `Message Queue′ (Hàng đợi tin nhắn) thường được dùng để làm gì?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

22. Trong bối cảnh Dữ liệu lớn, `ETL′ (Extract, Transform, Load) thường được thay thế bằng quy trình nào linh hoạt hơn?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

23. Kiến trúc `Lambda Architecture′ trong Dữ liệu lớn được thiết kế để xử lý loại hình phân tích nào?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

24. Phương pháp `Data Sampling′ (Lấy mẫu dữ liệu) được sử dụng trong Dữ liệu lớn khi nào?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

25. Trong phân tích Dữ liệu lớn, `Machine Learning′ (Học máy) được sử dụng để làm gì?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

26. Loại dữ liệu nào sau đây KHÔNG thuộc `Variety′ (Tính đa dạng) trong đặc điểm của Dữ liệu lớn?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

27. Yếu tố nào sau đây KHÔNG phải là một thách thức lớn đối với Dữ liệu lớn?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

28. Thuật ngữ `Data Lake′ (Hồ dữ liệu) trong Dữ liệu lớn dùng để chỉ điều gì?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

29. Công nghệ NoSQL thường được sử dụng trong Dữ liệu lớn để giải quyết vấn đề gì?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 2

30. Công cụ nào sau đây KHÔNG phải là một nền tảng phân tích Dữ liệu lớn phổ biến trên đám mây?