Đề 14 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Dữ liệu lớn (BigData)

Đề 14 - Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

1. Công cụ nào sau đây được thiết kế để xử lý dữ liệu lớn trong bộ nhớ (in-memory processing), giúp tăng tốc độ tính toán?

A. HDFS.
B. MapReduce.
C. Spark.
D. Hive.

2. Hệ thống tập tin phân tán HDFS là thành phần cốt lõi của framework nào trong Big Data?

A. Spark.
B. Kafka.
C. Hadoop.
D. Cassandra.

3. Vai trò của kỹ sư dữ liệu (Data Engineer) trong dự án Big Data là gì?

A. Phân tích dữ liệu và đưa ra insights.
B. Xây dựng và quản lý hạ tầng dữ liệu, đảm bảo dữ liệu sẵn sàng cho phân tích.
C. Thiết kế giao diện người dùng cho ứng dụng Big Data.
D. Quản lý dự án và giao tiếp với khách hàng.

4. Vấn đề về quyền riêng tư (data privacy) trong Big Data phát sinh chủ yếu từ đâu?

A. Sự thiếu hụt công nghệ lưu trữ dữ liệu.
B. Khả năng thu thập và phân tích lượng lớn dữ liệu cá nhân.
C. Chi phí triển khai hệ thống Big Data cao.
D. Sự phức tạp của các thuật toán phân tích dữ liệu.

5. Mục tiêu chính của phân tích dữ liệu dự đoán (Predictive Analytics) trong Big Data là gì?

A. Hiểu rõ hơn về quá khứ.
B. Đưa ra quyết định trong thời gian thực.
C. Dự báo các sự kiện hoặc xu hướng có thể xảy ra trong tương lai.
D. Tối ưu hóa quy trình hoạt động hiện tại.

6. Quản trị dữ liệu (data governance) trong Big Data nhằm mục đích gì?

A. Tăng tốc độ xử lý dữ liệu.
B. Đảm bảo chất lượng, tính toàn vẹn và tuân thủ quy định của dữ liệu.
C. Giảm chi phí lưu trữ dữ liệu.
D. Đơn giản hóa quy trình phân tích dữ liệu.

7. Khả năng mở rộng (scalability) là một yêu cầu quan trọng của hệ thống Big Data vì điều gì?

A. Để giảm chi phí đầu tư ban đầu.
B. Để xử lý dữ liệu với tốc độ chậm hơn.
C. Để đáp ứng sự tăng trưởng liên tục của dữ liệu theo thời gian.
D. Để giới hạn số lượng người dùng truy cập dữ liệu.

8. Nguồn dữ liệu nào sau đây KHÔNG phải là nguồn phổ biến của Big Data?

A. Dữ liệu từ mạng xã hội (social media data).
B. Dữ liệu từ cảm biến IoT (IoT sensor data).
C. Dữ liệu từ hệ thống giao dịch ngân hàng truyền thống.
D. Dữ liệu từ các cuộc khảo sát thủ công trên giấy.

9. NoSQL databases thường được ưa chuộng trong Big Data vì lý do chính nào?

A. Khả năng quản lý các giao dịch phức tạp (ACID properties).
B. Khả năng mở rộng linh hoạt và xử lý dữ liệu phi cấu trúc tốt.
C. Tính năng bảo mật mạnh mẽ và kiểm soát truy cập chi tiết.
D. Chi phí triển khai và vận hành thấp hơn so với relational databases.

10. Quy trình ETL (Extract, Transform, Load) đóng vai trò gì trong dự án Big Data?

A. Trực quan hóa dữ liệu để dễ dàng phân tích.
B. Thu thập, làm sạch, chuyển đổi và tải dữ liệu vào hệ thống lưu trữ.
C. Xây dựng mô hình máy học để dự đoán xu hướng.
D. Đảm bảo tính bảo mật và quyền riêng tư của dữ liệu.

11. Đặc điểm 'Volume′ (Khối lượng) trong Big Data đề cập đến yếu tố nào?

A. Sự đa dạng của các loại dữ liệu khác nhau.
B. Tốc độ tạo ra và xử lý dữ liệu nhanh chóng.
C. Kích thước dữ liệu cực lớn và ngày càng tăng.
D. Độ tin cậy và chính xác của dữ liệu.

12. Yếu tố 'Value′ (Giá trị) trong 5Vs của Big Data nhấn mạnh điều gì?

A. Sự đa dạng trong nguồn gốc dữ liệu.
B. Tốc độ xử lý dữ liệu nhanh chóng.
C. Khối lượng dữ liệu khổng lồ cần xử lý.
D. Giá trị kinh doanh và thông tin hữu ích có thể khai thác từ dữ liệu.

13. Thách thức lớn nhất về bảo mật dữ liệu (data security) trong Big Data là gì?

A. Dung lượng lưu trữ dữ liệu quá lớn.
B. Tốc độ xử lý dữ liệu chậm.
C. Số lượng lớn và đa dạng nguồn dữ liệu cần bảo vệ.
D. Thiếu công cụ phân tích dữ liệu hiệu quả.

14. Lĩnh vực tài chính ngân hàng ứng dụng Big Data để phát hiện và ngăn chặn điều gì?

A. Tăng cường rủi ro tín dụng.
B. Giảm thiểu gian lận và rửa tiền.
C. Làm chậm quá trình xử lý giao dịch.
D. Giảm khả năng dự báo thị trường.

15. Phân tích dữ liệu mô tả (Descriptive Analytics) trong Big Data tập trung vào việc trả lời câu hỏi nào?

A. Điều gì sẽ xảy ra trong tương lai?
B. Tại sao điều này đã xảy ra?
C. Điều gì đang xảy ra?
D. Chúng ta nên làm gì?

16. Một trong những rủi ro đạo đức (ethical risks) khi sử dụng Big Data là gì?

A. Tăng cường tính minh bạch trong quyết định.
B. Giảm thiểu sự thiên vị trong thuật toán.
C. Sử dụng dữ liệu cá nhân mà không có sự đồng ý hoặc gây phân biệt đối xử.
D. Đảm bảo quyền riêng tư tuyệt đối cho người dùng.

17. Phân tích dữ liệu chỉ định (Prescriptive Analytics) trong Big Data hướng đến việc gì?

A. Mô tả các mẫu và xu hướng trong dữ liệu quá khứ.
B. Giải thích lý do đằng sau các sự kiện đã xảy ra.
C. Đề xuất các hành động và quyết định tối ưu để đạt mục tiêu.
D. Dự đoán các rủi ro và cơ hội trong tương lai gần.

18. Trong bối cảnh Big Data, 'Variety′ (Đa dạng) muốn nhấn mạnh điều gì về dữ liệu?

A. Nguồn gốc dữ liệu đến từ nhiều nơi khác nhau trên thế giới.
B. Dữ liệu tồn tại ở nhiều định dạng khác nhau như có cấu trúc, bán cấu trúc và phi cấu trúc.
C. Tốc độ mà dữ liệu được tạo ra và truyền tải.
D. Giá trị thông tin tiềm ẩn có thể khai thác từ dữ liệu.

19. Đặc tính 'Veracity′ (Tính xác thực) của Big Data đề cập đến vấn đề gì?

A. Khả năng chuyển đổi dữ liệu sang các định dạng khác nhau.
B. Mức độ tin cậy, chính xác và đáng tin cậy của nguồn dữ liệu.
C. Dung lượng lưu trữ cần thiết để chứa dữ liệu.
D. Các phương pháp và công cụ để phân tích dữ liệu.

20. Nhà khoa học dữ liệu (Data Scientist) sử dụng Big Data để thực hiện công việc chính nào?

A. Quản lý hệ thống lưu trữ dữ liệu.
B. Phân tích dữ liệu, khám phá insights và xây dựng mô hình dự đoán.
C. Phát triển ứng dụng web dựa trên Big Data.
D. Đảm bảo an ninh mạng cho hệ thống Big Data.

21. Ứng dụng Big Data trong lĩnh vực y tế có thể giúp cải thiện điều gì?

A. Tăng chi phí khám chữa bệnh.
B. Giảm hiệu quả của việc chẩn đoán bệnh.
C. Cá nhân hóa phương pháp điều trị và dự đoán dịch bệnh.
D. Hạn chế khả năng nghiên cứu và phát triển thuốc mới.

22. Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) trong Big Data giúp làm sáng tỏ điều gì?

A. Dự đoán xu hướng và kết quả tương lai.
B. Xác định nguyên nhân gốc rễ của các sự kiện đã xảy ra.
C. Đề xuất hành động tối ưu dựa trên dữ liệu.
D. Mô tả tổng quan về dữ liệu hiện có.

23. Sự khác biệt chính giữa Big Data và dữ liệu truyền thống (traditional data) là gì?

A. Dữ liệu truyền thống có kích thước lớn hơn Big Data.
B. Big Data có tốc độ xử lý chậm hơn dữ liệu truyền thống.
C. Big Data thường có các đặc tính 5Vs (Volume, Velocity, Variety, Veracity, Value) mà dữ liệu truyền thống không có hoặc có ở mức độ thấp hơn.
D. Dữ liệu truyền thống không thể được phân tích và khai thác giá trị.

24. Trong lĩnh vực sản xuất, Big Data góp phần vào việc tối ưu hóa quy trình nào?

A. Tăng chi phí sản xuất.
B. Giảm chất lượng sản phẩm.
C. Dự đoán bảo trì thiết bị và tối ưu hóa hiệu suất.
D. Làm chậm quá trình đổi mới sản phẩm.

25. Trong ngành bán lẻ, Big Data thường được sử dụng để đạt được mục tiêu nào?

A. Giảm số lượng khách hàng trung thành.
B. Tăng chi phí marketing và quảng cáo.
C. Cá nhân hóa trải nghiệm mua sắm và tối ưu hóa chuỗi cung ứng.
D. Làm chậm quá trình ra quyết định kinh doanh.

26. Chất lượng dữ liệu (data quality) là yếu tố quan trọng trong Big Data vì sao?

A. Dữ liệu chất lượng kém làm tăng tốc độ xử lý.
B. Phân tích dữ liệu chất lượng kém dẫn đến quyết định sai lầm.
C. Dữ liệu chất lượng thấp giúp tiết kiệm chi phí lưu trữ.
D. Chất lượng dữ liệu không ảnh hưởng đến kết quả phân tích Big Data.

27. Trong kiến trúc Big Data, Data Lake (hồ dữ liệu) được sử dụng để làm gì?

A. Xử lý dữ liệu theo thời gian thực.
B. Lưu trữ dữ liệu thô ở nhiều định dạng khác nhau trước khi xử lý.
C. Tổ chức dữ liệu có cấu trúc để truy vấn nhanh chóng.
D. Trực quan hóa dữ liệu đã qua xử lý.

28. Vòng đời dữ liệu lớn (Big Data lifecycle) thường bắt đầu từ giai đoạn nào?

A. Phân tích dữ liệu (Data Analysis).
B. Thu thập dữ liệu (Data Collection).
C. Trực quan hóa dữ liệu (Data Visualization).
D. Lưu trữ dữ liệu (Data Storage).

29. Thuật ngữ 'Velocity′ (Tốc độ) trong Big Data liên quan trực tiếp đến khía cạnh nào?

A. Mức độ xác thực và đáng tin cậy của dữ liệu.
B. Khả năng mở rộng hệ thống để chứa lượng dữ liệu lớn.
C. Tốc độ dữ liệu được tạo ra, thu thập và xử lý theo thời gian thực.
D. Sự phức tạp và khó khăn trong việc phân tích dữ liệu.

30. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn phân tán?

A. MySQL.
B. Hadoop.
C. Microsoft Excel.
D. Microsoft Word.

1 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

1. Công cụ nào sau đây được thiết kế để xử lý dữ liệu lớn trong bộ nhớ (in-memory processing), giúp tăng tốc độ tính toán?

2 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

2. Hệ thống tập tin phân tán HDFS là thành phần cốt lõi của framework nào trong Big Data?

3 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

3. Vai trò của kỹ sư dữ liệu (Data Engineer) trong dự án Big Data là gì?

4 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

4. Vấn đề về quyền riêng tư (data privacy) trong Big Data phát sinh chủ yếu từ đâu?

5 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

5. Mục tiêu chính của phân tích dữ liệu dự đoán (Predictive Analytics) trong Big Data là gì?

6 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

6. Quản trị dữ liệu (data governance) trong Big Data nhằm mục đích gì?

7 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

7. Khả năng mở rộng (scalability) là một yêu cầu quan trọng của hệ thống Big Data vì điều gì?

8 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

8. Nguồn dữ liệu nào sau đây KHÔNG phải là nguồn phổ biến của Big Data?

9 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

9. NoSQL databases thường được ưa chuộng trong Big Data vì lý do chính nào?

10 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

10. Quy trình ETL (Extract, Transform, Load) đóng vai trò gì trong dự án Big Data?

11 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

11. Đặc điểm `Volume′ (Khối lượng) trong Big Data đề cập đến yếu tố nào?

12 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

12. Yếu tố `Value′ (Giá trị) trong 5Vs của Big Data nhấn mạnh điều gì?

13 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

13. Thách thức lớn nhất về bảo mật dữ liệu (data security) trong Big Data là gì?

14 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

14. Lĩnh vực tài chính ngân hàng ứng dụng Big Data để phát hiện và ngăn chặn điều gì?

15 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

15. Phân tích dữ liệu mô tả (Descriptive Analytics) trong Big Data tập trung vào việc trả lời câu hỏi nào?

16 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

16. Một trong những rủi ro đạo đức (ethical risks) khi sử dụng Big Data là gì?

17 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

17. Phân tích dữ liệu chỉ định (Prescriptive Analytics) trong Big Data hướng đến việc gì?

18 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

18. Trong bối cảnh Big Data, `Variety′ (Đa dạng) muốn nhấn mạnh điều gì về dữ liệu?

19 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

19. Đặc tính `Veracity′ (Tính xác thực) của Big Data đề cập đến vấn đề gì?

20 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

20. Nhà khoa học dữ liệu (Data Scientist) sử dụng Big Data để thực hiện công việc chính nào?

21 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

21. Ứng dụng Big Data trong lĩnh vực y tế có thể giúp cải thiện điều gì?

22 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

22. Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) trong Big Data giúp làm sáng tỏ điều gì?

23 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

23. Sự khác biệt chính giữa Big Data và dữ liệu truyền thống (traditional data) là gì?

24 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

24. Trong lĩnh vực sản xuất, Big Data góp phần vào việc tối ưu hóa quy trình nào?

25 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

25. Trong ngành bán lẻ, Big Data thường được sử dụng để đạt được mục tiêu nào?

26 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

26. Chất lượng dữ liệu (data quality) là yếu tố quan trọng trong Big Data vì sao?

27 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

27. Trong kiến trúc Big Data, Data Lake (hồ dữ liệu) được sử dụng để làm gì?

28 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

28. Vòng đời dữ liệu lớn (Big Data lifecycle) thường bắt đầu từ giai đoạn nào?

29 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

29. Thuật ngữ `Velocity′ (Tốc độ) trong Big Data liên quan trực tiếp đến khía cạnh nào?

30 / 30

Category: Dữ liệu lớn (BigData)

Tags: Bộ đề 14

30. Công nghệ nào sau đây thường được sử dụng để lưu trữ và xử lý dữ liệu lớn phân tán?