Đề 12 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 12 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Apache Kafka thường được sử dụng trong Big Data cho mục đích gì?

A. Lưu trữ dữ liệu phi cấu trúc.
B. Xử lý dữ liệu batch.
C. Xây dựng pipeline dữ liệu streaming và message queue.
D. Phân tích dữ liệu bằng thuật toán machine learning.

2. Đặc tính 'Velocity′ (Vận tốc) của Big Data liên quan trực tiếp đến:

A. Kích thước vật lý của thiết bị lưu trữ dữ liệu.
B. Tốc độ tạo ra và xử lý dữ liệu theo thời gian thực hoặc gần thời gian thực.
C. Số lượng người dùng truy cập dữ liệu đồng thời.
D. Độ phức tạp của thuật toán phân tích dữ liệu.

3. Trong mô hình MapReduce, giai đoạn 'Map′ có chức năng chính là:

A. Tổng hợp kết quả từ các giai đoạn Reduce.
B. Phân chia dữ liệu đầu vào thành các phần nhỏ và xử lý song song.
C. Sắp xếp và nhóm các cặp key-value.
D. Lưu trữ kết quả cuối cùng vào hệ thống tệp.

4. Trong bối cảnh Big Data, 'Value′ (Giá trị) đề cập đến:

A. Chi phí đầu tư vào cơ sở hạ tầng Big Data.
B. Giá trị kinh tế hoặc lợi ích kinh doanh mà dữ liệu lớn mang lại.
C. Kích thước của bộ dữ liệu sau khi đã được làm sạch và xử lý.
D. Thời gian cần thiết để phân tích và khai thác dữ liệu.

5. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Big Data?

A. Phân tích hành vi khách hàng trên mạng xã hội để cá nhân hóa quảng cáo.
B. Dự báo thời tiết dựa trên dữ liệu từ nhiều nguồn khác nhau.
C. Quản lý danh sách liên lạc cá nhân trên điện thoại.
D. Tối ưu hóa lộ trình giao thông dựa trên dữ liệu GPS thời gian thực.

6. Khái niệm 'Data Mining′ (Khai thác dữ liệu) trong Big Data liên quan đến:

A. Thu thập dữ liệu từ các nguồn công khai.
B. Làm sạch và chuẩn hóa dữ liệu.
C. Tìm kiếm các mẫu, xu hướng và thông tin ẩn sâu trong dữ liệu.
D. Bảo mật dữ liệu khỏi truy cập trái phép.

7. Ngôn ngữ lập trình nào thường được sử dụng rộng rãi trong hệ sinh thái Hadoop và Spark để xử lý Big Data?

A. C++.
B. Java và Python.
C. Assembly.
D. Fortran.

8. Trong lĩnh vực Tài chính - Ngân hàng, Big Data được sử dụng để:

A. Tăng cường tốc độ giao dịch ngân hàng trực tuyến.
B. Phát triển các ứng dụng mobile banking.
C. Phát hiện gian lận, đánh giá rủi ro tín dụng và cá nhân hóa dịch vụ khách hàng.
D. Quản lý hệ thống ATM trên toàn quốc.

9. Khái niệm 'Data Lakehouse′ là sự kết hợp giữa ưu điểm của Data Warehouse và Data Lake, vậy nó mang lại lợi ích gì?

A. Chỉ lưu trữ dữ liệu có cấu trúc.
B. Khả năng xử lý giao dịch (transactional) mạnh mẽ như RDBMS.
C. Vừa có khả năng quản lý dữ liệu có cấu trúc và phi cấu trúc, vừa hỗ trợ truy vấn SQL và các tính năng quản trị dữ liệu.
D. Giảm thiểu chi phí hạ tầng lưu trữ.

10. Thách thức về 'Data Silos′ (Các silo dữ liệu) trong tổ chức liên quan đến vấn đề gì?

A. Dữ liệu bị trùng lặp và không nhất quán.
B. Dữ liệu được phân tán và cô lập trong các bộ phận khác nhau, gây khó khăn cho việc tích hợp và khai thác toàn diện.
C. Dữ liệu không được bảo mật đúng cách.
D. Dữ liệu quá lớn để xử lý.

11. Ứng dụng của Big Data trong lĩnh vực Y tế có thể KHÔNG bao gồm:

A. Phân tích hồ sơ bệnh án điện tử để cải thiện chẩn đoán và điều trị.
B. Dự đoán dịch bệnh và phân bố nguồn lực y tế.
C. Theo dõi hoạt động thể chất cá nhân bằng thiết bị đeo thông minh.
D. Thay đổi nhóm máu của bệnh nhân dựa trên phân tích dữ liệu.

12. Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề gì?

A. Bảo mật dữ liệu.
B. Xử lý đồng thời cả dữ liệu batch và dữ liệu streaming.
C. Giảm chi phí lưu trữ dữ liệu.
D. Tăng tốc độ truy vấn dữ liệu lịch sử.

13. Thách thức lớn nhất khi làm việc với Big Data thường KHÔNG bao gồm:

A. Lưu trữ và quản lý lượng dữ liệu khổng lồ.
B. Xử lý dữ liệu với tốc độ cao để kịp thời đưa ra quyết định.
C. Đảm bảo tính bảo mật và riêng tư của dữ liệu.
D. Dễ dàng tìm kiếm thông tin trong dữ liệu có cấu trúc nhỏ gọn.

14. Vai trò của 'Data Governance′ (Quản trị dữ liệu) trong Big Data là gì?

A. Tăng tốc độ xử lý dữ liệu.
B. Đảm bảo chất lượng, tính toàn vẹn, bảo mật và tuân thủ quy định của dữ liệu.
C. Giảm dung lượng lưu trữ dữ liệu.
D. Trực quan hóa dữ liệu cho người dùng cuối.

15. Công cụ nào sau đây thường được sử dụng cho xử lý dữ liệu Big Data theo thời gian thực (real-time processing)?

A. Hadoop MapReduce.
B. Apache Spark Streaming.
C. Hệ quản trị cơ sở dữ liệu SQL truyền thống.
D. Microsoft Excel.

16. Đặc điểm 'Volume′ (Khối lượng) trong Big Data đề cập đến yếu tố nào là chính?

A. Tốc độ xử lý dữ liệu cực nhanh.
B. Sự đa dạng về loại và nguồn dữ liệu.
C. Dung lượng dữ liệu cực lớn và ngày càng tăng.
D. Độ tin cậy và tính xác thực của dữ liệu.

17. Giai đoạn 'Reduce′ trong MapReduce có nhiệm vụ chính là:

A. Đọc dữ liệu đầu vào từ hệ thống tệp.
B. Phân chia công việc cho các node xử lý.
C. Tổng hợp và xử lý các cặp key-value trung gian để tạo ra kết quả cuối cùng.
D. Kiểm tra lỗi và đảm bảo tính toàn vẹn dữ liệu.

18. Trong lĩnh vực Bán lẻ, Big Data giúp các doanh nghiệp:

A. Sản xuất hàng loạt sản phẩm.
B. Tối ưu hóa chuỗi cung ứng, dự đoán nhu cầu thị trường và cá nhân hóa trải nghiệm mua sắm.
C. Xây dựng hệ thống thanh toán trực tuyến.
D. Quản lý kho hàng thủ công.

19. Ứng dụng Big Data trong Giao thông vận tải KHÔNG bao gồm:

A. Tối ưu hóa lộ trình và giảm ùn tắc giao thông.
B. Quản lý đội xe và bảo trì phương tiện hiệu quả hơn.
C. Dự đoán và quản lý luồng hành khách trong giao thông công cộng.
D. Thiết kế lại động cơ xe ô tô.

20. Khi nói về 'Scalability′ (Khả năng mở rộng) trong Big Data, ta thường đề cập đến khả năng:

A. Giảm kích thước dữ liệu để dễ dàng quản lý.
B. Tăng cường bảo mật dữ liệu.
C. Hệ thống có thể xử lý lượng dữ liệu và tải công việc tăng lên mà vẫn duy trì hiệu suất.
D. Trực quan hóa dữ liệu dễ dàng hơn.

21. Thuật ngữ 'Variety′ (Đa dạng) trong Big Data ám chỉ điều gì?

A. Tốc độ dữ liệu được tạo ra và xử lý.
B. Khả năng thay đổi cấu trúc dữ liệu linh hoạt.
C. Sự khác biệt về nguồn gốc, định dạng và loại dữ liệu (có cấu trúc, bán cấu trúc, phi cấu trúc).
D. Mức độ tin cậy và chính xác của dữ liệu thu thập.

22. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý Big Data phân tán?

A. Microsoft Excel.
B. Hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) truyền thống.
C. Hadoop và các hệ sinh thái liên quan.
D. Phần mềm soạn thảo văn bản như Microsoft Word.

23. Yếu tố 'Veracity′ (Tính xác thực) trong Big Data nhấn mạnh vào:

A. Khả năng mở rộng của hệ thống lưu trữ dữ liệu.
B. Sự đa dạng trong phương pháp phân tích dữ liệu.
C. Độ tin cậy, độ chính xác và chất lượng của dữ liệu thu thập được.
D. Tốc độ truyền tải dữ liệu giữa các hệ thống.

24. Thuật ngữ 'Data Wrangling′ (Chuẩn bị dữ liệu) trong Big Data bao gồm các công việc nào?

A. Phân tích dữ liệu và tạo báo cáo.
B. Thu thập dữ liệu từ các nguồn khác nhau.
C. Làm sạch, chuyển đổi, và chuẩn hóa dữ liệu để sẵn sàng cho phân tích.
D. Bảo mật và mã hóa dữ liệu.

25. Phương pháp 'Data Virtualization′ (Ảo hóa dữ liệu) giúp giải quyết vấn đề gì trong Big Data?

A. Tăng cường bảo mật dữ liệu.
B. Giảm chi phí lưu trữ dữ liệu.
C. Truy cập và tích hợp dữ liệu từ nhiều nguồn khác nhau mà không cần di chuyển dữ liệu vật lý.
D. Tăng tốc độ xử lý dữ liệu streaming.

26. Trong lĩnh vực Big Data, 'Machine Learning′ (Học máy) được ứng dụng để:

A. Lưu trữ dữ liệu với dung lượng lớn.
B. Trực quan hóa dữ liệu dưới dạng đồ thị và biểu đồ.
C. Xây dựng mô hình dự đoán, phân loại, và khai phá tri thức từ dữ liệu.
D. Thu thập dữ liệu từ các nguồn trên internet.

27. Phân tích 'Predictive Analytics′ (Phân tích dự đoán) trong Big Data tập trung vào:

A. Mô tả những gì đã xảy ra trong quá khứ.
B. Chẩn đoán nguyên nhân của các sự kiện đã xảy ra.
C. Dự đoán xu hướng và sự kiện có thể xảy ra trong tương lai.
D. Trực quan hóa dữ liệu để dễ dàng theo dõi.

28. Trong kiến trúc Big Data, tầng 'Data Ingestion′ (Thu thập dữ liệu) có vai trò chính là:

A. Phân tích và trực quan hóa dữ liệu.
B. Lưu trữ dữ liệu đã qua xử lý.
C. Thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Đảm bảo tính bảo mật cho dữ liệu.

29. Ưu điểm chính của việc sử dụng cơ sở dữ liệu NoSQL trong Big Data so với RDBMS truyền thống là gì?

A. Chi phí đầu tư thấp hơn.
B. Khả năng mở rộng linh hoạt và xử lý tốt dữ liệu phi cấu trúc.
C. Tính năng bảo mật mạnh mẽ hơn.
D. Dễ dàng tích hợp với các hệ thống cũ.

30. Data Warehouse (Kho dữ liệu) và Data Lake (Hồ dữ liệu) khác nhau chủ yếu ở điểm nào?

A. Data Warehouse chỉ lưu trữ dữ liệu lịch sử, còn Data Lake lưu trữ dữ liệu hiện tại.
B. Data Warehouse lưu trữ dữ liệu đã qua xử lý và có cấu trúc, Data Lake lưu trữ dữ liệu thô ở nhiều định dạng.
C. Data Warehouse sử dụng công nghệ NoSQL, Data Lake sử dụng SQL.
D. Data Warehouse dành cho doanh nghiệp nhỏ, Data Lake dành cho doanh nghiệp lớn.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

1. Apache Kafka thường được sử dụng trong Big Data cho mục đích gì?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

2. Đặc tính `Velocity′ (Vận tốc) của Big Data liên quan trực tiếp đến:

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

3. Trong mô hình MapReduce, giai đoạn `Map′ có chức năng chính là:

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

4. Trong bối cảnh Big Data, `Value′ (Giá trị) đề cập đến:

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

5. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của Big Data?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

6. Khái niệm `Data Mining′ (Khai thác dữ liệu) trong Big Data liên quan đến:

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

7. Ngôn ngữ lập trình nào thường được sử dụng rộng rãi trong hệ sinh thái Hadoop và Spark để xử lý Big Data?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

8. Trong lĩnh vực Tài chính - Ngân hàng, Big Data được sử dụng để:

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

9. Khái niệm `Data Lakehouse′ là sự kết hợp giữa ưu điểm của Data Warehouse và Data Lake, vậy nó mang lại lợi ích gì?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

10. Thách thức về `Data Silos′ (Các silo dữ liệu) trong tổ chức liên quan đến vấn đề gì?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

11. Ứng dụng của Big Data trong lĩnh vực Y tế có thể KHÔNG bao gồm:

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

12. Kiến trúc Lambda trong Big Data được thiết kế để giải quyết vấn đề gì?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

13. Thách thức lớn nhất khi làm việc với Big Data thường KHÔNG bao gồm:

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

14. Vai trò của `Data Governance′ (Quản trị dữ liệu) trong Big Data là gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

15. Công cụ nào sau đây thường được sử dụng cho xử lý dữ liệu Big Data theo thời gian thực (real-time processing)?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

16. Đặc điểm `Volume′ (Khối lượng) trong Big Data đề cập đến yếu tố nào là chính?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

17. Giai đoạn `Reduce′ trong MapReduce có nhiệm vụ chính là:

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

18. Trong lĩnh vực Bán lẻ, Big Data giúp các doanh nghiệp:

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

19. Ứng dụng Big Data trong Giao thông vận tải KHÔNG bao gồm:

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

20. Khi nói về `Scalability′ (Khả năng mở rộng) trong Big Data, ta thường đề cập đến khả năng:

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

21. Thuật ngữ `Variety′ (Đa dạng) trong Big Data ám chỉ điều gì?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

22. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý Big Data phân tán?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

23. Yếu tố `Veracity′ (Tính xác thực) trong Big Data nhấn mạnh vào:

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

24. Thuật ngữ `Data Wrangling′ (Chuẩn bị dữ liệu) trong Big Data bao gồm các công việc nào?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

25. Phương pháp `Data Virtualization′ (Ảo hóa dữ liệu) giúp giải quyết vấn đề gì trong Big Data?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

26. Trong lĩnh vực Big Data, `Machine Learning′ (Học máy) được ứng dụng để:

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

27. Phân tích `Predictive Analytics′ (Phân tích dự đoán) trong Big Data tập trung vào:

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

28. Trong kiến trúc Big Data, tầng `Data Ingestion′ (Thu thập dữ liệu) có vai trò chính là:

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

29. Ưu điểm chính của việc sử dụng cơ sở dữ liệu NoSQL trong Big Data so với RDBMS truyền thống là gì?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 12

30. Data Warehouse (Kho dữ liệu) và Data Lake (Hồ dữ liệu) khác nhau chủ yếu ở điểm nào?