1. Đâu là nhược điểm chính của thuật toán Decision Tree (cây quyết định)?
A. Khó diễn giải kết quả.
B. Dễ bị overfitting, đặc biệt với cây sâu.
C. Không thể xử lý dữ liệu số.
D. Yêu cầu lượng dữ liệu huấn luyện rất lớn.
2. Kỹ thuật 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong học máy?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Ước lượng hiệu suất của mô hình trên dữ liệu chưa từng thấy.
C. Giảm thời gian huấn luyện mô hình.
D. Chọn thuật toán học máy tốt nhất.
3. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction)?
A. Phân tích thành phần chính (PCA)
B. Phân tích phân biệt tuyến tính (LDA)
C. K-Means Clustering
D. Tự mã hóa (Autoencoders)
4. Trong các loại học máy sau, loại nào thường được sử dụng để phân loại email thành 'spam′ hoặc 'không spam′?
A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)
5. Ưu điểm chính của thuật toán Random Forest so với một cây quyết định (Decision Tree) đơn lẻ là gì?
A. Dễ diễn giải hơn.
B. Ít bị overfitting hơn.
C. Huấn luyện nhanh hơn.
D. Yêu cầu ít dữ liệu huấn luyện hơn.
6. Phương pháp học máy nào phù hợp nhất khi bạn có dữ liệu KHÔNG được gán nhãn và muốn tìm cấu trúc ẩn trong dữ liệu đó?
A. Học có giám sát (Supervised Learning)
B. Học tăng cường (Reinforcement Learning)
C. Học không giám sát (Unsupervised Learning)
D. Học bán giám sát (Semi-supervised Learning)
7. Mục tiêu chính của 'anomaly detection′ (phát hiện bất thường) trong học máy là gì?
A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị số liên tục.
C. Xác định các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu còn lại.
D. Tăng cường chất lượng dữ liệu đầu vào.
8. Trong học máy, 'feature scaling′ (tỉ lệ đặc trưng) thường được thực hiện trước khi huấn luyện mô hình để làm gì?
A. Giảm số lượng đặc trưng.
B. Đảm bảo các đặc trưng có cùng phạm vi giá trị, giúp thuật toán hội tụ nhanh hơn.
C. Tăng độ chính xác của mô hình.
D. Chọn đặc trưng quan trọng nhất.
9. Độ đo 'precision′ (độ chính xác) trong đánh giá mô hình phân loại được tính bằng công thức nào?
A. TP ∕ (TP + FN)
B. TN ∕ (TN + FP)
C. TP ∕ (TP + FP)
D. TN ∕ (TN + FN)
10. Kỹ thuật 'dropout′ được sử dụng trong mạng nơ-ron để làm gì?
A. Tăng tốc độ huấn luyện mạng.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác của mạng trên dữ liệu huấn luyện.
D. Chuẩn hóa dữ liệu đầu vào cho mạng.
11. Khái niệm 'gradient descent′ (hạ gradient) được sử dụng để làm gì trong huấn luyện mô hình học máy?
A. Đánh giá hiệu suất của mô hình.
B. Tìm giá trị tối ưu của các tham số mô hình để giảm thiểu hàm mất mát.
C. Chọn đặc trưng (feature selection) quan trọng nhất.
D. Chia dữ liệu thành tập huấn luyện và tập kiểm tra.
12. Thuật ngữ 'overfitting′ (quá khớp) trong học máy đề cập đến hiện tượng gì?
A. Mô hình hoạt động quá chậm do kích thước dữ liệu lớn.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.
C. Mô hình không thể học được từ dữ liệu huấn luyện.
D. Mô hình sử dụng quá nhiều tài nguyên tính toán.
13. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong lĩnh vực nào?
A. Xử lý ngôn ngữ tự nhiên (NLP)
B. Dự báo chuỗi thời gian
C. Thị giác máy tính (Computer Vision)
D. Học tăng cường (Reinforcement Learning)
14. Trong ngữ cảnh của học máy và đạo đức, 'algorithmic bias′ (thiên kiến thuật toán) đề cập đến vấn đề gì?
A. Thuật toán chạy chậm hơn mong đợi.
B. Thuật toán đưa ra dự đoán không chính xác.
C. Thuật toán phản ánh hoặc khuếch đại sự thiên vị có trong dữ liệu huấn luyện.
D. Thuật toán sử dụng quá nhiều tài nguyên tính toán.
15. Độ đo 'recall′ (độ phủ) trong đánh giá mô hình phân loại được tính bằng công thức nào?
A. TP ∕ (TP + FP)
B. TN ∕ (TN + FN)
C. TP ∕ (TP + FN)
D. TN ∕ (TN + FP)
16. Trong xử lý ảnh, 'augmentation′ (tăng cường dữ liệu) được sử dụng để làm gì?
A. Giảm kích thước ảnh để tiết kiệm bộ nhớ.
B. Tạo thêm dữ liệu huấn luyện bằng cách biến đổi ảnh gốc (xoay, lật, v.v.).
C. Cải thiện chất lượng ảnh đầu vào.
D. Nén ảnh để tăng tốc độ xử lý.
17. Đâu là định nghĩa chính xác nhất về Học máy (Machine Learning)?
A. Lập trình rõ ràng các bước để máy tính thực hiện một tác vụ cụ thể.
B. Cho phép máy tính học từ dữ liệu mà không cần được lập trình một cách tường minh.
C. Sử dụng máy tính để lưu trữ và truy xuất dữ liệu hiệu quả.
D. Phát triển phần mềm ứng dụng trên nền tảng web.
18. Phương pháp nào sau đây KHÔNG phải là một thuật toán phân cụm (clustering)?
A. K-Means
B. DBSCAN
C. Support Vector Machine (SVM)
D. Phân cụm phân cấp (Hierarchical Clustering)
19. Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'word embedding′ (nhúng từ) giúp làm gì?
A. Biên dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
B. Biểu diễn từ ngữ dưới dạng vector số, giữ lại thông tin ngữ nghĩa.
C. Phân loại văn bản dựa trên chủ đề.
D. Loại bỏ các từ dừng (stop words) khỏi văn bản.
20. Phương pháp đánh giá mô hình nào phù hợp nhất cho bài toán phân loại có dữ liệu mất cân bằng (imbalanced dataset)?
A. Accuracy (Độ chính xác).
B. Confusion Matrix (Ma trận nhầm lẫn).
C. F1-score và AUC-ROC.
D. Recall (Độ phủ).
21. Trong thuật toán K-Means, điều gì xảy ra trong mỗi lần lặp (iteration)?
A. Các điểm dữ liệu được gán lại vào cụm gần nhất và các centroid cụm được tính lại.
B. Các điểm dữ liệu được di chuyển ngẫu nhiên giữa các cụm.
C. Số lượng cụm (K) được tự động điều chỉnh.
D. Thuật toán tìm kiếm cụm có kích thước lớn nhất.
22. Thuật ngữ 'bias-variance tradeoff′ (đánh đổi giữa độ chệch và phương sai) trong học máy mô tả điều gì?
A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác mô hình.
B. Sự đánh đổi giữa độ phức tạp của mô hình và khả năng khái quát hóa.
C. Sự đánh đổi giữa độ chính xác trên tập huấn luyện và tập kiểm tra.
D. Sự đánh đổi giữa số lượng đặc trưng và số lượng mẫu dữ liệu.
23. Trong học sâu, 'pooling layer′ (lớp gộp) thường được sử dụng sau lớp tích chập (convolutional layer) để làm gì?
A. Tăng số lượng tham số trong mạng.
B. Giảm kích thước không gian của đặc trưng và giảm độ nhạy với vị trí.
C. Thêm tính phi tuyến vào mạng.
D. Chuẩn hóa đầu ra của lớp tích chập.
24. Mô hình học máy nào sau đây thường được sử dụng cho bài toán hồi quy (regression)?
A. Support Vector Machine (SVM) với kernel tuyến tính.
B. K-Nearest Neighbors (KNN).
C. Linear Regression (Hồi quy tuyến tính).
D. Naive Bayes.
25. Kỹ thuật 'regularization′ (chính quy hóa) được sử dụng trong học máy để làm gì?
A. Tăng độ chính xác của mô hình trên dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình và tránh overfitting.
C. Tăng tốc độ hội tụ của thuật toán huấn luyện.
D. Chuẩn hóa dữ liệu đầu vào.
26. Độ đo 'F1-score′ là trung bình điều hòa của hai độ đo nào?
A. Precision và Accuracy.
B. Recall và Specificity.
C. Precision và Recall.
D. Accuracy và Recall.
27. Trong mạng nơ-ron, 'backpropagation′ (lan truyền ngược) là thuật toán để làm gì?
A. Dự đoán đầu ra của mạng nơ-ron.
B. Tính toán gradient của hàm mất mát theo các tham số mạng.
C. Khởi tạo trọng số của mạng nơ-ron.
D. Chọn kiến trúc mạng nơ-ron phù hợp.
28. Trong học tăng cường (Reinforcement Learning), 'agent′ (tác nhân) tương tác với môi trường để làm gì?
A. Phân loại dữ liệu trong môi trường.
B. Dự đoán trạng thái tiếp theo của môi trường.
C. Tối đa hóa phần thưởng tích lũy theo thời gian.
D. Thu thập dữ liệu từ môi trường.
29. Trong học sâu (Deep Learning), hàm kích hoạt (activation function) có vai trò chính là gì?
A. Tăng tốc độ huấn luyện mô hình.
B. Đưa tính phi tuyến vào mạng nơ-ron.
C. Giảm thiểu lỗi trong quá trình huấn luyện.
D. Chuẩn hóa dữ liệu đầu vào.
30. Trong học máy, 'hyperparameter′ (siêu tham số) khác với 'parameter′ (tham số) ở điểm nào?
A. Hyperparameter được học từ dữ liệu, còn parameter được thiết lập thủ công.
B. Parameter được học từ dữ liệu, còn hyperparameter được thiết lập trước khi huấn luyện.
C. Hyperparameter chỉ xuất hiện trong mô hình học sâu, parameter thì không.
D. Parameter ảnh hưởng đến tốc độ huấn luyện, hyperparameter thì không.