Đề 7 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Khai phá dữ liệu

Đề 7 - Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

1. Khái niệm 'feature selection′ (lựa chọn thuộc tính) trong khai phá dữ liệu nhằm mục đích gì?

A. Tăng số lượng thuộc tính trong tập dữ liệu.
B. Chọn ra tập hợp con các thuộc tính quan trọng nhất.
C. Tạo ra thuộc tính mới từ thuộc tính hiện có.
D. Ẩn danh hóa các thuộc tính nhạy cảm.

2. Độ đo 'độ chính xác′ (accuracy) thường được sử dụng để đánh giá hiệu suất của mô hình nào trong khai phá dữ liệu?

A. Mô hình phân cụm (Clustering model).
B. Mô hình hồi quy (Regression model).
C. Mô hình phân loại (Classification model).
D. Mô hình luật kết hợp (Association rule model).

3. Kỹ thuật 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong khai phá dữ liệu?

A. Tăng kích thước tập dữ liệu.
B. Đánh giá khả năng tổng quát hóa của mô hình.
C. Làm sạch dữ liệu nhiễu.
D. Chọn thuộc tính quan trọng nhất.

4. Trong ngữ cảnh khai phá dữ liệu lớn (big data mining), thách thức chính thường liên quan đến điều gì?

A. Sự thiếu hụt dữ liệu.
B. Kích thước dữ liệu quá lớn và tốc độ tạo dữ liệu nhanh.
C. Dữ liệu quá sạch và dễ xử lý.
D. Thuật toán khai phá dữ liệu quá hiệu quả.

5. Mục đích của việc 'rời rạc hóa dữ liệu′ (data discretization) là gì?

A. Chuyển đổi dữ liệu số thành dữ liệu hạng mục.
B. Chuyển đổi dữ liệu hạng mục thành dữ liệu số.
C. Giảm số lượng bản ghi dữ liệu.
D. Tăng độ chính xác của dữ liệu số.

6. Phương pháp nào sau đây KHÔNG thuộc nhóm phương pháp phân cụm?

A. K-means.
B. DBSCAN.
C. Hierarchical Clustering.
D. Naive Bayes.

7. Thuật ngữ 'KDD′ thường được sử dụng thay thế cho 'Khai phá dữ liệu′. KDD là viết tắt của cụm từ nào?

A. Knowledge and Data Discovery.
B. Knowledge Discovery in Databases.
C. Key Data and Decisions.
D. Knowledge Definition and Data.

8. Phương pháp nào sau đây thuộc nhóm 'học có giám sát′ (supervised learning) trong khai phá dữ liệu?

A. K-means Clustering.
B. Apriori Algorithm.
C. Decision Tree Classification.
D. Principal Component Analysis (PCA).

9. Kỹ thuật 'bootstrapping′ thường được sử dụng trong khai phá dữ liệu để làm gì?

A. Xử lý dữ liệu bị thiếu.
B. Đánh giá độ tin cậy của mô hình.
C. Giảm kích thước dữ liệu.
D. Phát hiện ngoại lệ trong dữ liệu.

10. Kỹ thuật nào sau đây có thể được sử dụng để giảm số chiều dữ liệu trong khai phá dữ liệu?

A. K-Nearest Neighbors (KNN).
B. Support Vector Machines (SVM).
C. Principal Component Analysis (PCA).
D. Decision Tree (Cây quyết định).

11. Kỹ thuật 'anomaly detection′ (phát hiện bất thường) được sử dụng để làm gì trong khai phá dữ liệu?

A. Phân loại dữ liệu vào các nhóm.
B. Tìm kiếm mẫu phổ biến trong dữ liệu.
C. Xác định các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu.
D. Dự đoán xu hướng tương lai của dữ liệu.

12. Trong khai phá dữ liệu, 'luật kết hợp′ (association rule) thường được sử dụng để làm gì?

A. Dự đoán giá trị số liên tục.
B. Phân loại dữ liệu vào các lớp khác nhau.
C. Tìm mối quan hệ thú vị giữa các biến.
D. Giảm số chiều dữ liệu.

13. Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để phân nhóm các đối tượng tương tự nhau thành các cụm?

A. Phân loại (Classification).
B. Hồi quy (Regression).
C. Phân cụm (Clustering).
D. Dự báo (Forecasting).

14. Phương pháp khai phá dữ liệu nào tập trung vào việc dự đoán giá trị số cho một biến mục tiêu dựa trên các biến đầu vào?

A. Phân loại (Classification).
B. Hồi quy (Regression).
C. Phân cụm (Clustering).
D. Khai thác luật kết hợp (Association rule mining).

15. Mục tiêu chính của khai phá dữ liệu là gì?

A. Tăng cường dung lượng lưu trữ dữ liệu.
B. Cải thiện tốc độ truy cập dữ liệu.
C. Phát hiện tri thức hữu ích từ dữ liệu.
D. Bảo mật dữ liệu khỏi truy cập trái phép.

16. Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào được xử lý chính?

A. Dữ liệu văn bản.
B. Dữ liệu hình ảnh.
C. Dữ liệu địa lý và không gian.
D. Dữ liệu chuỗi thời gian.

17. Độ đo 'recall′ (độ phủ) trong đánh giá mô hình phân loại được tính bằng công thức nào?

A. TP ∕ (TP + FP).
B. TN ∕ (TN + FN).
C. TP ∕ (TP + FN).
D. TN ∕ (TN + FP).

18. Thuật toán Apriori được sử dụng chủ yếu trong loại khai phá dữ liệu nào?

A. Phân loại (Classification).
B. Phân cụm (Clustering).
C. Khai thác luật kết hợp (Association rule mining).
D. Hồi quy (Regression).

19. Bước nào sau đây KHÔNG phải là một bước điển hình trong quy trình khai phá dữ liệu?

A. Tiền xử lý dữ liệu (Data Preprocessing).
B. Đánh giá mô hình (Model Evaluation).
C. Sao lưu dữ liệu (Data Backup).
D. Khai thác mẫu (Pattern Mining).

20. Độ đo 'precision′ (độ chuẩn xác) trong đánh giá mô hình phân loại được tính bằng công thức nào?

A. TP ∕ (TP + FN).
B. TN ∕ (TN + FP).
C. TP ∕ (TP + FP).
D. TN ∕ (TN + FN).

21. Trong khai phá dữ liệu, 'support′ (độ hỗ trợ) của một luật kết hợp đo lường điều gì?

A. Độ chính xác của luật.
B. Tần suất xuất hiện đồng thời của tiền đề và kết luận trong dữ liệu.
C. Mức độ thú vị của luật.
D. Độ tin cậy của luật.

22. Phương pháp 'gradient descent′ (hạ gradient) thường được sử dụng để làm gì trong khai phá dữ liệu?

A. Giảm chiều dữ liệu.
B. Tối ưu hóa tham số của mô hình học máy.
C. Phân cụm dữ liệu.
D. Phát hiện luật kết hợp.

23. Trong khai phá dữ liệu, 'ensemble methods′ (phương pháp tập hợp) thường được sử dụng để làm gì?

A. Giảm thiểu số lượng thuộc tính.
B. Cải thiện độ chính xác và độ ổn định của mô hình.
C. Tăng tốc độ huấn luyện mô hình.
D. Xử lý dữ liệu bị thiếu.

24. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), mục tiêu chính thường là gì?

A. Phân cụm các chuỗi thời gian tương tự.
B. Dự đoán giá trị tương lai dựa trên dữ liệu quá khứ.
C. Tìm luật kết hợp trong chuỗi thời gian.
D. Tất cả các đáp án trên.

25. Trong khai phá dữ liệu web, 'web usage mining′ (khai phá sử dụng web) tập trung vào việc phân tích dữ liệu nào?

A. Nội dung trang web (web page content).
B. Cấu trúc liên kết giữa các trang web (web link structure).
C. Hành vi duyệt web của người dùng (user web browsing behavior).
D. Thiết kế giao diện trang web (web page interface design).

26. Trong khai phá dữ liệu, 'overfitting′ (quá khớp) xảy ra khi nào?

A. Mô hình quá đơn giản và không nắm bắt được cấu trúc dữ liệu.
B. Mô hình hoạt động tốt trên dữ liệu kiểm tra nhưng kém trên dữ liệu huấn luyện.
C. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra mới.
D. Mô hình được huấn luyện quá nhanh và không hội tụ.

27. Trong khai phá dữ liệu đa phương tiện (multimedia data mining), loại dữ liệu nào KHÔNG được xử lý?

A. Hình ảnh.
B. Video.
C. Âm thanh.
D. Dữ liệu tài chính.

28. Trong tiền xử lý dữ liệu, kỹ thuật 'chuẩn hóa dữ liệu′ (data normalization) nhằm mục đích gì?

A. Giảm kích thước tập dữ liệu.
B. Chuyển đổi dữ liệu về cùng một thang đo.
C. Loại bỏ dữ liệu trùng lặp.
D. Mã hóa dữ liệu dạng văn bản sang dạng số.

29. Thuật ngữ 'lift′ trong luật kết hợp đo lường điều gì?

A. Độ phổ biến của một mục.
B. Độ tin cậy của luật.
C. Mức độ tương quan giữa tiền đề và kết luận của luật.
D. Độ hỗ trợ của luật.

30. Trong khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF′ thường được sử dụng để làm gì?

A. Phân tích cảm xúc văn bản.
B. Trích xuất thực thể có tên.
C. Đo lường tầm quan trọng của từ trong văn bản.
D. Phân loại chủ đề văn bản.

1 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

1. Khái niệm `feature selection′ (lựa chọn thuộc tính) trong khai phá dữ liệu nhằm mục đích gì?

2 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

2. Độ đo `độ chính xác′ (accuracy) thường được sử dụng để đánh giá hiệu suất của mô hình nào trong khai phá dữ liệu?

3 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

3. Kỹ thuật `cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong khai phá dữ liệu?

4 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

4. Trong ngữ cảnh khai phá dữ liệu lớn (big data mining), thách thức chính thường liên quan đến điều gì?

5 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

5. Mục đích của việc `rời rạc hóa dữ liệu′ (data discretization) là gì?

6 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

6. Phương pháp nào sau đây KHÔNG thuộc nhóm phương pháp phân cụm?

7 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

7. Thuật ngữ `KDD′ thường được sử dụng thay thế cho `Khai phá dữ liệu′. KDD là viết tắt của cụm từ nào?

8 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

8. Phương pháp nào sau đây thuộc nhóm `học có giám sát′ (supervised learning) trong khai phá dữ liệu?

9 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

9. Kỹ thuật `bootstrapping′ thường được sử dụng trong khai phá dữ liệu để làm gì?

10 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

10. Kỹ thuật nào sau đây có thể được sử dụng để giảm số chiều dữ liệu trong khai phá dữ liệu?

11 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

11. Kỹ thuật `anomaly detection′ (phát hiện bất thường) được sử dụng để làm gì trong khai phá dữ liệu?

12 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

12. Trong khai phá dữ liệu, `luật kết hợp′ (association rule) thường được sử dụng để làm gì?

13 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

13. Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để phân nhóm các đối tượng tương tự nhau thành các cụm?

14 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

14. Phương pháp khai phá dữ liệu nào tập trung vào việc dự đoán giá trị số cho một biến mục tiêu dựa trên các biến đầu vào?

15 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

15. Mục tiêu chính của khai phá dữ liệu là gì?

16 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

16. Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào được xử lý chính?

17 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

17. Độ đo `recall′ (độ phủ) trong đánh giá mô hình phân loại được tính bằng công thức nào?

18 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

18. Thuật toán Apriori được sử dụng chủ yếu trong loại khai phá dữ liệu nào?

19 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

19. Bước nào sau đây KHÔNG phải là một bước điển hình trong quy trình khai phá dữ liệu?

20 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

20. Độ đo `precision′ (độ chuẩn xác) trong đánh giá mô hình phân loại được tính bằng công thức nào?

21 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

21. Trong khai phá dữ liệu, `support′ (độ hỗ trợ) của một luật kết hợp đo lường điều gì?

22 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

22. Phương pháp `gradient descent′ (hạ gradient) thường được sử dụng để làm gì trong khai phá dữ liệu?

23 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

23. Trong khai phá dữ liệu, `ensemble methods′ (phương pháp tập hợp) thường được sử dụng để làm gì?

24 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

24. Trong khai phá dữ liệu chuỗi thời gian (time series data mining), mục tiêu chính thường là gì?

25 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

25. Trong khai phá dữ liệu web, `web usage mining′ (khai phá sử dụng web) tập trung vào việc phân tích dữ liệu nào?

26 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

26. Trong khai phá dữ liệu, `overfitting′ (quá khớp) xảy ra khi nào?

27 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

27. Trong khai phá dữ liệu đa phương tiện (multimedia data mining), loại dữ liệu nào KHÔNG được xử lý?

28 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

28. Trong tiền xử lý dữ liệu, kỹ thuật `chuẩn hóa dữ liệu′ (data normalization) nhằm mục đích gì?

29 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

29. Thuật ngữ `lift′ trong luật kết hợp đo lường điều gì?

30 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 8

30. Trong khai phá dữ liệu văn bản (text mining), kỹ thuật `TF-IDF′ thường được sử dụng để làm gì?