Đề 3 – Bài tập, đề thi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 3 - Bài tập, đề thi trắc nghiệm online Học máy

1. Độ đo 'độ chính xác′ (Accuracy) trong bài toán phân loại (classification) được tính như thế nào?

A. Tỷ lệ mẫu âm tính được dự đoán đúng.
B. Tỷ lệ mẫu dương tính được dự đoán đúng.
C. Tỷ lệ mẫu được dự đoán đúng trên tổng số mẫu.
D. Trung bình cộng của độ chính xác và độ phủ.

2. Trong bài toán hồi quy (regression), độ đo 'Mean Squared Error′ (MSE) thể hiện điều gì?

A. Tỷ lệ dự đoán đúng.
B. Giá trị trung bình của sai số tuyệt đối.
C. Giá trị trung bình của bình phương sai số giữa giá trị dự đoán và giá trị thực tế.
D. Độ lệch chuẩn của sai số.

3. Phương pháp 'Dimensionality Reduction′ (giảm chiều dữ liệu) được sử dụng khi nào?

A. Khi dữ liệu có quá ít đặc trưng.
B. Khi dữ liệu có quá nhiều đặc trưng, gây ra 'lời nguyền chiều cao′ và tăng độ phức tạp tính toán.
C. Khi cần tăng độ chính xác của mô hình.
D. Khi cần trực quan hóa dữ liệu.

4. Học máy (Machine Learning) được định nghĩa chính xác nhất là gì?

A. Một lĩnh vực khoa học máy tính tập trung vào việc viết mã chương trình phức tạp.
B. Một phương pháp thống kê để phân tích dữ liệu và rút ra kết luận.
C. Một lĩnh vực khoa học máy tính cho phép hệ thống máy tính học từ dữ liệu mà không cần được lập trình яв яв explicitly.
D. Một kỹ thuật phần mềm để tối ưu hóa hiệu suất của ứng dụng.

5. Thuật toán K-Means Clustering thuộc loại học máy nào?

A. Học tăng cường (Reinforcement Learning)
B. Học có giám sát (Supervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học không giám sát (Unsupervised Learning)

6. Trong mạng nơ-ron (Neural Network), hàm kích hoạt (activation function) có vai trò gì?

A. Tăng tốc độ huấn luyện mạng nơ-ron.
B. Giới thiệu tính phi tuyến (non-linearity) vào mạng nơ-ron.
C. Chuẩn hóa dữ liệu đầu vào.
D. Giảm số lượng tham số trong mạng nơ-ron.

7. Trong học sâu (Deep Learning), 'Convolutional Neural Network′ (CNN) đặc biệt phù hợp cho loại dữ liệu nào?

A. Dữ liệu dạng bảng (tabular data).
B. Dữ liệu văn bản.
C. Dữ liệu hình ảnh và video.
D. Dữ liệu chuỗi thời gian.

8. Phương pháp 'Cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá và lựa chọn mô hình tốt nhất, đồng thời ước tính hiệu năng tổng quát hóa của mô hình.
C. Giảm thời gian huấn luyện mô hình.
D. Giải quyết vấn đề dữ liệu bị thiếu.

9. Phương pháp 'Gradient Descent′ được sử dụng chủ yếu trong học máy để làm gì?

A. Tìm kiếm siêu tham số (hyperparameters) tối ưu cho mô hình.
B. Giảm thiểu hàm mất mát (loss function) và tối ưu hóa tham số mô hình.
C. Phân cụm dữ liệu không nhãn.
D. Chọn lọc đặc trưng (feature selection) quan trọng nhất.

10. Kỹ thuật 'Dropout′ thường được sử dụng trong mạng nơ-ron để làm gì?

A. Tăng tốc độ hội tụ của mô hình.
B. Giảm hiện tượng quá khớp (overfitting).
C. Tăng độ chính xác trên tập huấn luyện.
D. Giảm số lượng tham số của mô hình.

11. Vấn đề 'dữ liệu không cân bằng′ (imbalanced data) trong bài toán phân loại có nghĩa là gì?

A. Dữ liệu huấn luyện có quá nhiều đặc trưng.
B. Số lượng mẫu của các lớp khác nhau trong tập dữ liệu huấn luyện chênh lệch nhau quá lớn.
C. Dữ liệu huấn luyện chứa nhiều giá trị bị thiếu.
D. Dữ liệu huấn luyện không được phân phối ngẫu nhiên.

12. Trong học máy, 'Ensemble Learning′ (học tập hợp) là gì?

A. Một phương pháp huấn luyện mô hình trên dữ liệu lớn.
B. Một kỹ thuật kết hợp dự đoán của nhiều mô hình học máy để cải thiện hiệu suất tổng thể.
C. Một cách tiếp cận để giảm chiều dữ liệu.
D. Một phương pháp để xử lý dữ liệu bị thiếu.

13. Trong học máy, 'học có giám sát′ (Supervised Learning) khác biệt chính so với 'học không giám sát′ (Unsupervised Learning) ở điểm nào?

A. Học có giám sát sử dụng ít dữ liệu hơn học không giám sát.
B. Học có giám sát sử dụng dữ liệu đã được gắn nhãn (labeled data), trong khi học không giám sát sử dụng dữ liệu chưa được gắn nhãn.
C. Học có giám sát chỉ áp dụng cho bài toán phân loại, còn học không giám sát cho bài toán hồi quy.
D. Học có giám sát luôn cho kết quả chính xác hơn học không giám sát.

14. Thuật toán 'Principal Component Analysis′ (PCA) là một ví dụ của phương pháp học máy nào?

A. Học tăng cường (Reinforcement Learning).
B. Học có giám sát (Supervised Learning).
C. Học không giám sát (Unsupervised Learning).
D. Học bán giám sát (Semi-supervised Learning).

15. Thuật toán 'K-Nearest Neighbors′ (KNN) thuộc loại học máy nào?

A. Học tăng cường (Reinforcement Learning).
B. Học có giám sát (Supervised Learning).
C. Học không giám sát (Unsupervised Learning).
D. Học bán giám sát (Semi-supervised Learning).

16. Trong ngữ cảnh của mô hình học máy, 'hyperparameter′ (siêu tham số) là gì?

A. Tham số được mô hình học từ dữ liệu huấn luyện.
B. Tham số được con người thiết lập trước khi huấn luyện mô hình.
C. Tham số quyết định độ phức tạp của mô hình.
D. Cả đáp án 2 và 3.

17. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?

A. Nhận dạng khuôn mặt.
B. Dự báo thời tiết.
C. Phân tích thị trường chứng khoán.
D. Viết tiểu thuyết tự động hoàn toàn.

18. Khái niệm 'Bias-Variance Tradeoff′ (đánh đổi Bias-Variance) trong học máy đề cập đến điều gì?

A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác của mô hình.
B. Sự đánh đổi giữa khả năng diễn giải mô hình và hiệu suất mô hình.
C. Sự đánh đổi giữa Bias (độ chệch) và Variance (phương sai) khi xây dựng mô hình, cần cân bằng để đạt hiệu suất tốt nhất.
D. Sự đánh đổi giữa độ chính xác trên tập huấn luyện và độ chính xác trên tập kiểm thử.

19. Kỹ thuật 'Normalization′ (chuẩn hóa) dữ liệu thường được thực hiện trước khi huấn luyện mô hình học máy để làm gì?

A. Tăng kích thước tập dữ liệu.
B. Đưa các đặc trưng về cùng một thang đo, tránh tình trạng các đặc trưng có giá trị lớn ảnh hưởng quá mức đến mô hình.
C. Giảm số lượng đặc trưng.
D. Xử lý dữ liệu bị thiếu.

20. Mục tiêu chính của việc 'chia tập dữ liệu′ thành tập huấn luyện (training set) và tập kiểm thử (testing set) trong học máy là gì?

A. Để tăng tốc độ huấn luyện mô hình.
B. Để đánh giá hiệu năng của mô hình trên dữ liệu mới, chưa từng thấy trong quá trình huấn luyện.
C. Để giảm thiểu dung lượng bộ nhớ cần thiết để lưu trữ dữ liệu.
D. Để đơn giản hóa quá trình tiền xử lý dữ liệu.

21. Thuật toán 'Support Vector Machine′ (SVM) đặc biệt hiệu quả trong bài toán nào?

A. Phân cụm dữ liệu lớn.
B. Phân loại (classification), đặc biệt khi không gian đặc trưng có chiều cao.
C. Dự báo chuỗi thời gian.
D. Giảm chiều dữ liệu.

22. Kỹ thuật 'chính quy hóa′ (Regularization) thường được sử dụng để giải quyết vấn đề nào trong học máy?

A. Thiếu dữ liệu huấn luyện.
B. Dữ liệu huấn luyện bị nhiễu.
C. Quá khớp (Overfitting).
D. Dữ liệu huấn luyện không cân bằng.

23. Phương pháp 'One-Hot Encoding′ được sử dụng để xử lý loại dữ liệu nào trong học máy?

A. Dữ liệu số liên tục.
B. Dữ liệu văn bản.
C. Dữ liệu phân loại (categorical data).
D. Dữ liệu chuỗi thời gian.

24. Mục tiêu của 'Confusion Matrix′ (ma trận nhầm lẫn) trong bài toán phân loại là gì?

A. Đánh giá độ chính xác của mô hình hồi quy.
B. Trực quan hóa hiệu suất của mô hình phân loại bằng cách hiển thị số lượng dự đoán đúng và sai cho từng lớp.
C. Tìm siêu tham số tối ưu cho mô hình.
D. Giảm chiều dữ liệu phân loại.

25. Đường cong 'ROC′ (Receiver Operating Characteristic) và giá trị 'AUC′ (Area Under the Curve) được sử dụng để đánh giá hiệu suất của mô hình nào?

A. Mô hình hồi quy.
B. Mô hình phân cụm.
C. Mô hình phân loại nhị phân (binary classification).
D. Mô hình giảm chiều dữ liệu.

26. Ưu điểm chính của thuật toán 'Random Forest′ so với 'Cây quyết định′ đơn lẻ là gì?

A. Random Forest nhanh hơn trong quá trình huấn luyện.
B. Random Forest dễ diễn giải hơn.
C. Random Forest giảm hiện tượng quá khớp và có độ ổn định cao hơn.
D. Random Forest đòi hỏi ít dữ liệu huấn luyện hơn.

27. Trong thuật toán 'Cây quyết định′ (Decision Tree), tiêu chí 'entropy′ được sử dụng để làm gì?

A. Đo lường độ chính xác của cây quyết định.
B. Đo lường độ thuần khiết của một nút (node) trong cây quyết định.
C. Tính toán khoảng cách giữa các điểm dữ liệu.
D. Xác định độ phức tạp của cây quyết định.

28. Kỹ thuật 'Feature Engineering′ trong học máy bao gồm những công việc chính nào?

A. Chọn thuật toán học máy phù hợp nhất.
B. Xây dựng, chọn lọc và biến đổi các đặc trưng (features) từ dữ liệu thô để cải thiện hiệu suất mô hình.
C. Tối ưu hóa siêu tham số của mô hình.
D. Đánh giá hiệu năng của mô hình trên tập kiểm thử.

29. Hiện tượng 'quá khớp′ (Overfitting) trong học máy xảy ra khi nào?

A. Mô hình học quá tốt trên tập huấn luyện nhưng kém trên tập kiểm thử.
B. Mô hình học quá kém trên cả tập huấn luyện và tập kiểm thử.
C. Mô hình đạt độ chính xác tuyệt đối trên cả tập huấn luyện và tập kiểm thử.
D. Mô hình không thể học được từ dữ liệu huấn luyện.

30. Trong học tăng cường (Reinforcement Learning), 'agent′ (tác nhân) học cách hành động trong 'environment′ (môi trường) để tối đa hóa yếu tố nào?

A. Thời gian huấn luyện.
B. Độ chính xác.
C. Phần thưởng tích lũy (cumulative reward).
D. Độ phức tạp của mô hình.

1 / 30

Category: Học máy

Tags: Bộ đề 3

1. Độ đo `độ chính xác′ (Accuracy) trong bài toán phân loại (classification) được tính như thế nào?

2 / 30

Category: Học máy

Tags: Bộ đề 3

2. Trong bài toán hồi quy (regression), độ đo `Mean Squared Error′ (MSE) thể hiện điều gì?

3 / 30

Category: Học máy

Tags: Bộ đề 3

3. Phương pháp `Dimensionality Reduction′ (giảm chiều dữ liệu) được sử dụng khi nào?

4 / 30

Category: Học máy

Tags: Bộ đề 3

4. Học máy (Machine Learning) được định nghĩa chính xác nhất là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 3

5. Thuật toán K-Means Clustering thuộc loại học máy nào?

6 / 30

Category: Học máy

Tags: Bộ đề 3

6. Trong mạng nơ-ron (Neural Network), hàm kích hoạt (activation function) có vai trò gì?

7 / 30

Category: Học máy

Tags: Bộ đề 3

7. Trong học sâu (Deep Learning), `Convolutional Neural Network′ (CNN) đặc biệt phù hợp cho loại dữ liệu nào?

8 / 30

Category: Học máy

Tags: Bộ đề 3

8. Phương pháp `Cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

9 / 30

Category: Học máy

Tags: Bộ đề 3

9. Phương pháp `Gradient Descent′ được sử dụng chủ yếu trong học máy để làm gì?

10 / 30

Category: Học máy

Tags: Bộ đề 3

10. Kỹ thuật `Dropout′ thường được sử dụng trong mạng nơ-ron để làm gì?

11 / 30

Category: Học máy

Tags: Bộ đề 3

11. Vấn đề `dữ liệu không cân bằng′ (imbalanced data) trong bài toán phân loại có nghĩa là gì?

12 / 30

Category: Học máy

Tags: Bộ đề 3

12. Trong học máy, `Ensemble Learning′ (học tập hợp) là gì?

13 / 30

Category: Học máy

Tags: Bộ đề 3

13. Trong học máy, `học có giám sát′ (Supervised Learning) khác biệt chính so với `học không giám sát′ (Unsupervised Learning) ở điểm nào?

14 / 30

Category: Học máy

Tags: Bộ đề 3

14. Thuật toán `Principal Component Analysis′ (PCA) là một ví dụ của phương pháp học máy nào?

15 / 30

Category: Học máy

Tags: Bộ đề 3

15. Thuật toán `K-Nearest Neighbors′ (KNN) thuộc loại học máy nào?

16 / 30

Category: Học máy

Tags: Bộ đề 3

16. Trong ngữ cảnh của mô hình học máy, `hyperparameter′ (siêu tham số) là gì?

17 / 30

Category: Học máy

Tags: Bộ đề 3

17. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?

18 / 30

Category: Học máy

Tags: Bộ đề 3

18. Khái niệm `Bias-Variance Tradeoff′ (đánh đổi Bias-Variance) trong học máy đề cập đến điều gì?

19 / 30

Category: Học máy

Tags: Bộ đề 3

19. Kỹ thuật `Normalization′ (chuẩn hóa) dữ liệu thường được thực hiện trước khi huấn luyện mô hình học máy để làm gì?

20 / 30

Category: Học máy

Tags: Bộ đề 3

20. Mục tiêu chính của việc `chia tập dữ liệu′ thành tập huấn luyện (training set) và tập kiểm thử (testing set) trong học máy là gì?

21 / 30

Category: Học máy

Tags: Bộ đề 3

21. Thuật toán `Support Vector Machine′ (SVM) đặc biệt hiệu quả trong bài toán nào?

22 / 30

Category: Học máy

Tags: Bộ đề 3

22. Kỹ thuật `chính quy hóa′ (Regularization) thường được sử dụng để giải quyết vấn đề nào trong học máy?

23 / 30

Category: Học máy

Tags: Bộ đề 3

23. Phương pháp `One-Hot Encoding′ được sử dụng để xử lý loại dữ liệu nào trong học máy?

24 / 30

Category: Học máy

Tags: Bộ đề 3

24. Mục tiêu của `Confusion Matrix′ (ma trận nhầm lẫn) trong bài toán phân loại là gì?

25 / 30

Category: Học máy

Tags: Bộ đề 3

25. Đường cong `ROC′ (Receiver Operating Characteristic) và giá trị `AUC′ (Area Under the Curve) được sử dụng để đánh giá hiệu suất của mô hình nào?

26 / 30

Category: Học máy

Tags: Bộ đề 3

26. Ưu điểm chính của thuật toán `Random Forest′ so với `Cây quyết định′ đơn lẻ là gì?

27 / 30

Category: Học máy

Tags: Bộ đề 3

27. Trong thuật toán `Cây quyết định′ (Decision Tree), tiêu chí `entropy′ được sử dụng để làm gì?

28 / 30

Category: Học máy

Tags: Bộ đề 3

28. Kỹ thuật `Feature Engineering′ trong học máy bao gồm những công việc chính nào?

29 / 30

Category: Học máy

Tags: Bộ đề 3

29. Hiện tượng `quá khớp′ (Overfitting) trong học máy xảy ra khi nào?

30 / 30

Category: Học máy

Tags: Bộ đề 3

30. Trong học tăng cường (Reinforcement Learning), `agent′ (tác nhân) học cách hành động trong `environment′ (môi trường) để tối đa hóa yếu tố nào?