Đề 9 – Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Khai phá dữ liệu

Đề 9 - Bài tập, đề thi trắc nghiệm online Khai phá dữ liệu

1. Trong khai phá dữ liệu, 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì?

A. Tăng kích thước tập dữ liệu
B. Đánh giá độ tin cậy của mô hình trên dữ liệu mới
C. Tiền xử lý dữ liệu
D. Trực quan hóa kết quả

2. Kỹ thuật 'Data Mining′ thường được áp dụng trong lĩnh vực y tế để làm gì?

A. Xây dựng bệnh viện thông minh
B. Dự đoán nguy cơ bệnh tật và hỗ trợ chẩn đoán
C. Quản lý hồ sơ bệnh án điện tử
D. Phát triển thuốc mới

3. Trong khai phá dữ liệu, 'dữ liệu nhiễu′ (noisy data) đề cập đến loại dữ liệu nào?

A. Dữ liệu đã được chuẩn hóa
B. Dữ liệu bị thiếu giá trị
C. Dữ liệu chứa lỗi hoặc giá trị ngoại lai
D. Dữ liệu có cấu trúc phức tạp

4. Trong khai phá dữ liệu, phương pháp nào thường được sử dụng để xử lý dữ liệu bị thiếu giá trị (missing values)?

A. Chuẩn hóa dữ liệu
B. Điền giá trị thiếu hoặc loại bỏ mẫu chứa giá trị thiếu
C. Giảm chiều dữ liệu
D. Phân cụm dữ liệu

5. Trong khai phá dữ liệu, thuật ngữ 'k-NN′ là viết tắt của cụm từ nào?

A. K-Nearest Neighbors
B. K-Means Clustering
C. K-Fold Cross-Validation
D. Kernelized Neural Network

6. Trong khai phá dữ liệu, 'outlier′ (giá trị ngoại lai) là gì?

A. Dữ liệu đã được chuẩn hóa
B. Dữ liệu bị thiếu giá trị
C. Giá trị dữ liệu khác biệt đáng kể so với phần lớn dữ liệu còn lại
D. Dữ liệu có cấu trúc phức tạp

7. Kỹ thuật nào trong khai phá dữ liệu thường được sử dụng để dự đoán giá trị của một biến số mục tiêu dựa trên một hoặc nhiều biến số đầu vào?

A. Phân tích tương quan
B. Phân tích hồi quy
C. Phân tích chuỗi thời gian
D. Phân tích thành phần chính

8. Đâu là một ứng dụng phổ biến của khai phá dữ liệu trong lĩnh vực thương mại điện tử?

A. Quản lý kho hàng
B. Đề xuất sản phẩm cho khách hàng
C. Tối ưu hóa quy trình sản xuất
D. Nghiên cứu thị trường

9. Mục tiêu chính của việc khai phá dữ liệu là gì?

A. Tạo ra các báo cáo thống kê mô tả dữ liệu
B. Tìm ra các mẫu và tri thức ẩn trong dữ liệu
C. Lưu trữ và quản lý dữ liệu hiệu quả hơn
D. Trực quan hóa dữ liệu một cách đẹp mắt

10. Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để giảm số chiều dữ liệu, giúp đơn giản hóa mô hình và tăng tốc độ xử lý?

A. Phân cụm (Clustering)
B. Phân lớp (Classification)
C. Giảm chiều (Dimensionality Reduction)
D. Hồi quy (Regression)

11. Đâu là một thách thức về đạo đức trong ứng dụng khai phá dữ liệu?

A. Sự thiếu hụt công cụ khai phá dữ liệu
B. Xâm phạm quyền riêng tư và sử dụng dữ liệu cá nhân không đúng mục đích
C. Chi phí lưu trữ dữ liệu lớn
D. Sự phức tạp của thuật toán

12. Thuật toán K-means thường được sử dụng trong kỹ thuật khai phá dữ liệu nào?

A. Phân lớp
B. Hồi quy
C. Phân cụm
D. Dự đoán chuỗi thời gian

13. Trong khai phá dữ liệu, 'mô hình hộp đen′ (black box model) có đặc điểm gì?

A. Dễ dàng giải thích cơ chế hoạt động
B. Khó giải thích cách đưa ra quyết định
C. Chỉ áp dụng cho dữ liệu số
D. Luôn cho kết quả chính xác

14. Phương pháp 'Principal Component Analysis′ (PCA) được sử dụng trong kỹ thuật khai phá dữ liệu nào?

A. Phân cụm
B. Phân lớp
C. Giảm chiều
D. Hồi quy

15. Thuật toán 'Apriori′ thường được sử dụng trong kỹ thuật khai phá dữ liệu nào?

A. Phân lớp
B. Phân cụm
C. Luật kết hợp
D. Hồi quy

16. Phương pháp 'Decision Tree′ (Cây quyết định) thuộc loại kỹ thuật khai phá dữ liệu nào?

A. Phân cụm
B. Phân lớp và hồi quy
C. Giảm chiều
D. Luật kết hợp

17. Trong khai phá dữ liệu văn bản, 'TF-IDF′ được sử dụng để làm gì?

A. Phân loại văn bản
B. Phân cụm văn bản
C. Đánh trọng số cho từ trong văn bản
D. Trích xuất thông tin từ văn bản

18. Trong khai phá dữ liệu, phương pháp 'luật kết hợp′ (association rule mining) thường được sử dụng để làm gì?

A. Dự đoán giá trị tương lai
B. Phân loại đối tượng vào các nhóm
C. Tìm ra các mối quan hệ giữa các biến số
D. Giảm số chiều dữ liệu

19. Độ đo 'precision′ (độ chính xác) trong đánh giá mô hình phân lớp được tính như thế nào?

A. Số lượng dự đoán đúng trên tổng số mẫu
B. Số lượng dự đoán đúng dương tính trên tổng số mẫu thực tế dương tính
C. Số lượng dự đoán đúng dương tính trên tổng số mẫu dự đoán dương tính
D. Số lượng dự đoán sai trên tổng số mẫu

20. Độ đo 'recall′ (độ phủ) trong đánh giá mô hình phân lớp được tính như thế nào?

A. Số lượng dự đoán đúng trên tổng số mẫu
B. Số lượng dự đoán đúng dương tính trên tổng số mẫu thực tế dương tính
C. Số lượng dự đoán đúng dương tính trên tổng số mẫu dự đoán dương tính
D. Số lượng dự đoán sai trên tổng số mẫu

21. Trong quá trình khai phá dữ liệu, bước nào thường được thực hiện đầu tiên?

A. Xây dựng mô hình
B. Đánh giá mô hình
C. Tiền xử lý dữ liệu
D. Trực quan hóa kết quả

22. Đâu là thách thức lớn nhất khi khai phá dữ liệu từ các nguồn dữ liệu lớn và phức tạp (Big Data)?

A. Sự thiếu hụt các công cụ trực quan hóa dữ liệu
B. Khả năng mở rộng và hiệu suất tính toán
C. Sự đơn giản của các thuật toán khai phá dữ liệu
D. Chi phí lưu trữ dữ liệu thấp

23. Trong khai phá dữ liệu chuỗi thời gian, phương pháp 'ARIMA′ thường được dùng để làm gì?

A. Phân cụm dữ liệu chuỗi thời gian
B. Dự báo giá trị chuỗi thời gian trong tương lai
C. Phân lớp chuỗi thời gian
D. Giảm chiều dữ liệu chuỗi thời gian

24. Trong mô hình hóa dữ liệu, hiện tượng 'overfitting′ (quá khớp) xảy ra khi nào?

A. Mô hình quá đơn giản, không nắm bắt được cấu trúc dữ liệu
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới
C. Dữ liệu huấn luyện quá ít
D. Mô hình chưa được huấn luyện đủ lâu

25. Phương pháp 'Naive Bayes′ thường được sử dụng cho bài toán khai phá dữ liệu nào?

A. Phân cụm
B. Phân lớp
C. Hồi quy
D. Giảm chiều

26. Trong khai phá dữ liệu, 'đánh giá mô hình′ (model evaluation) có vai trò quan trọng như thế nào?

A. Để chọn ra thuộc tính quan trọng nhất
B. Để xác định độ tin cậy và hiệu quả của mô hình
C. Để tiền xử lý dữ liệu đầu vào
D. Để trực quan hóa kết quả khai phá

27. Trong quá trình tiền xử lý dữ liệu, 'chuẩn hóa dữ liệu′ (data normalization) nhằm mục đích chính là gì?

A. Tăng kích thước tập dữ liệu
B. Đảm bảo dữ liệu không bị trùng lặp
C. Đưa dữ liệu về cùng một thang đo
D. Mã hóa dữ liệu thành dạng số

28. Phương pháp khai phá dữ liệu nào tập trung vào việc tìm ra các nhóm đối tượng tương tự nhau trong một tập dữ liệu, mà không cần biết trước các nhóm này?

A. Phân tích hồi quy
B. Phân cụm
C. Phân lớp
D. Dự đoán

29. Phương pháp 'Support Vector Machine′ (SVM) chủ yếu được sử dụng cho bài toán khai phá dữ liệu nào?

A. Phân cụm
B. Phân lớp và hồi quy
C. Luật kết hợp
D. Giảm chiều

30. Kỹ thuật 'Feature Selection′ (Chọn lọc đặc trưng) trong tiền xử lý dữ liệu có mục đích gì?

A. Tạo ra các đặc trưng mới từ dữ liệu hiện có
B. Giảm số lượng đặc trưng bằng cách chọn ra các đặc trưng quan trọng nhất
C. Tăng kích thước tập dữ liệu
D. Mã hóa các đặc trưng dạng văn bản thành dạng số

1 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

1. Trong khai phá dữ liệu, `cross-validation′ (kiểm định chéo) được sử dụng để làm gì?

2 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

2. Kỹ thuật `Data Mining′ thường được áp dụng trong lĩnh vực y tế để làm gì?

3 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

3. Trong khai phá dữ liệu, `dữ liệu nhiễu′ (noisy data) đề cập đến loại dữ liệu nào?

4 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

4. Trong khai phá dữ liệu, phương pháp nào thường được sử dụng để xử lý dữ liệu bị thiếu giá trị (missing values)?

5 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

5. Trong khai phá dữ liệu, thuật ngữ `k-NN′ là viết tắt của cụm từ nào?

6 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

6. Trong khai phá dữ liệu, `outlier′ (giá trị ngoại lai) là gì?

7 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

7. Kỹ thuật nào trong khai phá dữ liệu thường được sử dụng để dự đoán giá trị của một biến số mục tiêu dựa trên một hoặc nhiều biến số đầu vào?

8 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

8. Đâu là một ứng dụng phổ biến của khai phá dữ liệu trong lĩnh vực thương mại điện tử?

9 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

9. Mục tiêu chính của việc khai phá dữ liệu là gì?

10 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

10. Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để giảm số chiều dữ liệu, giúp đơn giản hóa mô hình và tăng tốc độ xử lý?

11 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

11. Đâu là một thách thức về đạo đức trong ứng dụng khai phá dữ liệu?

12 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

12. Thuật toán K-means thường được sử dụng trong kỹ thuật khai phá dữ liệu nào?

13 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

13. Trong khai phá dữ liệu, `mô hình hộp đen′ (black box model) có đặc điểm gì?

14 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

14. Phương pháp `Principal Component Analysis′ (PCA) được sử dụng trong kỹ thuật khai phá dữ liệu nào?

15 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

15. Thuật toán `Apriori′ thường được sử dụng trong kỹ thuật khai phá dữ liệu nào?

16 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

16. Phương pháp `Decision Tree′ (Cây quyết định) thuộc loại kỹ thuật khai phá dữ liệu nào?

17 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

17. Trong khai phá dữ liệu văn bản, `TF-IDF′ được sử dụng để làm gì?

18 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

18. Trong khai phá dữ liệu, phương pháp `luật kết hợp′ (association rule mining) thường được sử dụng để làm gì?

19 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

19. Độ đo `precision′ (độ chính xác) trong đánh giá mô hình phân lớp được tính như thế nào?

20 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

20. Độ đo `recall′ (độ phủ) trong đánh giá mô hình phân lớp được tính như thế nào?

21 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

21. Trong quá trình khai phá dữ liệu, bước nào thường được thực hiện đầu tiên?

22 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

22. Đâu là thách thức lớn nhất khi khai phá dữ liệu từ các nguồn dữ liệu lớn và phức tạp (Big Data)?

23 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

23. Trong khai phá dữ liệu chuỗi thời gian, phương pháp `ARIMA′ thường được dùng để làm gì?

24 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

24. Trong mô hình hóa dữ liệu, hiện tượng `overfitting′ (quá khớp) xảy ra khi nào?

25 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

25. Phương pháp `Naive Bayes′ thường được sử dụng cho bài toán khai phá dữ liệu nào?

26 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

26. Trong khai phá dữ liệu, `đánh giá mô hình′ (model evaluation) có vai trò quan trọng như thế nào?

27 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

27. Trong quá trình tiền xử lý dữ liệu, `chuẩn hóa dữ liệu′ (data normalization) nhằm mục đích chính là gì?

28 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

28. Phương pháp khai phá dữ liệu nào tập trung vào việc tìm ra các nhóm đối tượng tương tự nhau trong một tập dữ liệu, mà không cần biết trước các nhóm này?

29 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

29. Phương pháp `Support Vector Machine′ (SVM) chủ yếu được sử dụng cho bài toán khai phá dữ liệu nào?

30 / 30

Category: Khai phá dữ liệu

Tags: Bộ đề 9

30. Kỹ thuật `Feature Selection′ (Chọn lọc đặc trưng) trong tiền xử lý dữ liệu có mục đích gì?