1. Đâu là một ví dụ về dữ liệu có cấu trúc (structured data)?
A. Nội dung một bài đăng trên mạng xã hội.
B. Một tệp âm thanh ghi âm cuộc phỏng vấn.
C. Một bảng tính với các hàng và cột rõ ràng (ví dụ: danh sách học sinh với tên, lớp, điểm số).
D. Một bức ảnh được chụp bằng điện thoại.
2. Đặc điểm nào sau đây KHÔNG phải là đặc điểm nổi bật của dữ liệu số trong thời đại thông tin?
A. Khả năng sao chép, lưu trữ và truyền tải dễ dàng.
B. Tính định lượng cao, có thể đo lường và phân tích.
C. Tính chất vật lý, khó bị biến đổi.
D. Khả năng biểu diễn đa dạng các loại thông tin.
3. Việc sử dụng dữ liệu số trong lĩnh vực giáo dục có thể mang lại lợi ích gì cho người học?
A. Tăng khối lượng bài tập về nhà một cách đáng kể.
B. Cung cấp các khóa học và tài liệu học tập phù hợp với năng lực và sở thích cá nhân.
C. Chỉ giúp giáo viên chấm điểm nhanh hơn.
D. Làm giảm sự tương tác giữa giáo viên và học sinh.
4. Một ví dụ về siêu dữ liệu (metadata) trong dữ liệu số là gì?
A. Nội dung chính của một bức ảnh, ví dụ: cảnh vật, con người.
B. Thời gian chụp, địa điểm chụp, loại máy ảnh đã dùng để tạo ra bức ảnh.
C. Kích thước của tệp ảnh, ví dụ: 5MB.
D. Chất lượng hình ảnh của bức ảnh, ví dụ: 1080p.
5. Khái niệm Big Data (Dữ liệu lớn) đề cập đến tập hợp dữ liệu có đặc điểm nào sau đây?
A. Chỉ các tập dữ liệu có dung lượng nhỏ, dễ quản lý.
B. Các tập dữ liệu có khối lượng, tốc độ và sự đa dạng cao.
C. Dữ liệu chỉ được tạo ra từ một nguồn duy nhất.
D. Dữ liệu chỉ mang tính chất định tính, không có định lượng.
6. Khi nói về tính kịp thời (timeliness) của dữ liệu số, điều này có nghĩa là gì?
A. Dữ liệu phải được tạo ra bởi nhiều người.
B. Dữ liệu phải sẵn sàng và có thể sử dụng được khi cần thiết.
C. Dữ liệu phải có dung lượng lớn.
D. Dữ liệu phải được lưu trữ trong một thời gian dài.
7. Thách thức lớn nhất khi làm việc với Big Data là gì?
A. Thiếu hụt các công cụ phân tích.
B. Khó khăn trong việc lưu trữ, quản lý và xử lý khối lượng dữ liệu khổng lồ.
C. Dữ liệu số không có giá trị thực tế.
D. Tốc độ xử lý dữ liệu quá chậm.
8. Việc áp dụng trí tuệ nhân tạo (AI) vào phân tích dữ liệu số có thể giúp ích gì cho việc dự báo xu hướng thị trường?
A. Làm cho dự báo trở nên hoàn toàn ngẫu nhiên.
B. Phát hiện các mẫu hình phức tạp và mối quan hệ ẩn trong dữ liệu để đưa ra dự báo chính xác hơn.
C. Chỉ giúp hiển thị các dữ liệu đã có.
D. Tăng cường chi phí vận hành.
9. Việc thu thập dữ liệu số từ các nguồn khác nhau như mạng xã hội, cảm biến, giao dịch trực tuyến nhằm mục đích chính là gì?
A. Tăng cường dung lượng lưu trữ trên thiết bị cá nhân.
B. Phục vụ cho việc phân tích, ra quyết định và tạo ra giá trị mới.
C. Làm phong phú thêm các tệp tin giải trí.
D. Giúp hiểu rõ hơn về cách hoạt động của các thiết bị điện tử.
10. Việc khai thác dữ liệu số từ các giao dịch mua sắm trực tuyến có thể giúp các nhà bán lẻ hiểu rõ điều gì về khách hàng?
A. Màu sắc yêu thích của khách hàng.
B. Hành vi mua sắm, sở thích, xu hướng tiêu dùng và các sản phẩm liên quan.
C. Số điện thoại của khách hàng.
D. Chỉ số BMI của khách hàng.
11. Tại sao dữ liệu số lại có vai trò quan trọng trong việc ra quyết định của các tổ chức, doanh nghiệp hiện nay?
A. Dữ liệu số giúp tăng tính thẩm mỹ cho các báo cáo.
B. Dữ liệu số cung cấp thông tin khách quan, có cơ sở để đánh giá và dự báo.
C. Dữ liệu số giúp giảm thiểu nhu cầu giao tiếp trực tiếp.
D. Dữ liệu số chỉ đơn thuần là các con số, không ảnh hưởng đến quyết định.
12. Một ví dụ về dữ liệu phi cấu trúc (unstructured data) là gì?
A. Danh sách các sản phẩm trong kho với mã hàng, số lượng, giá.
B. Một email chứa nội dung văn bản, người gửi, người nhận, chủ đề.
C. Một tệp CSV chứa dữ liệu bán hàng.
D. Một bảng dữ liệu về nhiệt độ và độ ẩm theo thời gian.
13. Vai trò của phân tích dữ liệu trong việc chuyển đổi số của một quốc gia là gì?
A. Chỉ giúp tạo ra các ứng dụng giải trí.
B. Hỗ trợ đưa ra các chính sách công dựa trên bằng chứng, thúc đẩy tăng trưởng kinh tế và nâng cao chất lượng cuộc sống.
C. Làm cho việc quản lý nhà nước trở nên phức tạp hơn.
D. Chỉ giúp lưu trữ thông tin.
14. Trong các yếu tố cấu thành Big Data (3V), Variety (Sự đa dạng) đề cập đến điều gì?
A. Khối lượng dữ liệu ngày càng tăng.
B. Tốc độ tạo ra và xử lý dữ liệu.
C. Sự khác nhau về định dạng và loại hình của dữ liệu.
D. Số lượng các nguồn dữ liệu.
15. Trong bối cảnh thời đại thông tin, kho dữ liệu (data warehouse) thường được sử dụng để làm gì?
A. Chỉ để lưu trữ tạm thời dữ liệu.
B. Tập hợp và lưu trữ dữ liệu từ nhiều nguồn khác nhau để phục vụ cho phân tích và báo cáo chiến lược.
C. Làm giảm tốc độ truy cập dữ liệu.
D. Chỉ chứa dữ liệu cá nhân.
16. Khi nói về Chất lượng dữ liệu, tiêu chí nào thể hiện sự đầy đủ và không thiếu sót của thông tin?
A. Tính nhất quán (Consistency).
B. Tính đầy đủ (Completeness).
C. Tính chính xác (Accuracy).
D. Tính kịp thời (Timeliness).
17. Tại sao tính chính xác (accuracy) lại là một trong những thuộc tính quan trọng nhất của dữ liệu số?
A. Dữ liệu chính xác giúp làm tăng dung lượng lưu trữ.
B. Dữ liệu chính xác đảm bảo các phân tích và quyết định dựa trên đó là đúng đắn và đáng tin cậy.
C. Dữ liệu chính xác làm cho việc xử lý trở nên chậm hơn.
D. Dữ liệu chính xác chỉ mang tính chất lý thuyết.
18. Việc phân tích dữ liệu số từ cảm biến giao thông có thể giúp ích gì cho việc quản lý đô thị?
A. Chỉ giúp hiển thị mật độ phương tiện.
B. Hỗ trợ tối ưu hóa luồng giao thông, giảm ùn tắc và cải thiện an toàn.
C. Làm cho hệ thống đèn giao thông hoạt động ngẫu nhiên.
D. Tăng cường nhu cầu sử dụng phương tiện cá nhân.
19. Yếu tố nào là quan trọng nhất để đảm bảo tính chính xác và tin cậy của dữ liệu số được sử dụng?
A. Dung lượng của tệp dữ liệu.
B. Nguồn gốc và quy trình thu thập, xử lý dữ liệu.
C. Định dạng tệp tin của dữ liệu.
D. Số lượng người dùng truy cập dữ liệu.
20. Khi đánh giá tính nhất quán (consistency) của dữ liệu, chúng ta cần kiểm tra điều gì?
A. Dữ liệu có được cập nhật thường xuyên không.
B. Dữ liệu có được định dạng giống nhau trên các hệ thống khác nhau không.
C. Dữ liệu có dễ dàng truy cập không.
D. Dữ liệu có được phân loại rõ ràng không.
21. Trong thời đại thông tin, dữ liệu số được hiểu là gì một cách bao quát nhất?
A. Thông tin được biểu diễn dưới dạng các con số và ký hiệu.
B. Các tệp văn bản, hình ảnh, âm thanh và video trên máy tính.
C. Tất cả các loại thông tin được lưu trữ và xử lý bằng máy tính.
D. Các con số được sử dụng trong tính toán khoa học.
22. Một ví dụ về dữ liệu bán cấu trúc (semi-structured data) là gì?
A. Một bản ghi SQL trong cơ sở dữ liệu.
B. Một tệp văn bản thuần túy.
C. Tệp XML hoặc JSON chứa các thẻ hoặc khóa và giá trị, nhưng không theo một bảng cứng nhắc.
D. Một bức ảnh kỹ thuật số.
23. Việc phân tích dữ liệu số có thể giúp ích gì cho việc phát triển các ứng dụng thông minh, ví dụ như xe tự lái?
A. Giúp xe tự lái chỉ đi theo một tuyến đường cố định.
B. Cung cấp thông tin để xe nhận diện môi trường, đưa ra quyết định lái xe an toàn.
C. Làm cho xe tự lái tiêu thụ nhiều năng lượng hơn.
D. Chỉ giúp xe tự lái hiển thị bản đồ.
24. Trong lĩnh vực y tế, phân tích dữ liệu số có thể đóng góp như thế nào vào việc cá nhân hóa điều trị?
A. Đưa ra các phương pháp điều trị chung cho tất cả bệnh nhân.
B. Giúp bác sĩ hiểu rõ hơn về tình trạng sức khỏe, lịch sử bệnh án và phản ứng với thuốc của từng bệnh nhân để đưa ra phác đồ phù hợp.
C. Chỉ giúp lưu trữ hồ sơ bệnh án điện tử.
D. Làm cho quá trình chẩn đoán trở nên phức tạp hơn.
25. Trong thời đại số, việc bảo mật dữ liệu cá nhân trở nên quan trọng vì lý do gì?
A. Dữ liệu cá nhân không có giá trị.
B. Ngăn chặn việc lạm dụng thông tin cá nhân, đánh cắp danh tính và các hành vi gian lận.
C. Dữ liệu cá nhân chỉ dùng để cá nhân hóa quảng cáo.
D. Bảo mật dữ liệu chỉ là yêu cầu kỹ thuật.