1. Trong học máy, 'độ trễ' (latency) thường đề cập đến yếu tố nào?
A. Thời gian cần thiết để huấn luyện mô hình.
B. Thời gian trễ giữa khi dữ liệu đầu vào được cung cấp và khi mô hình đưa ra dự đoán.
C. Độ chính xác của mô hình.
D. Kích thước của mô hình sau khi huấn luyện.
2. Trong thuật toán SVM (Support Vector Machine), 'kernel trick′ cho phép làm gì?
A. Giảm số lượng vectơ hỗ trợ.
B. Ánh xạ dữ liệu sang không gian chiều cao hơn để tìm siêu phẳng phân tách tuyến tính trong không gian mới, dù dữ liệu gốc có thể không phân tách tuyến tính.
C. Tăng tốc độ huấn luyện SVM.
D. Cải thiện khả năng diễn giải của SVM.
3. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?
A. Phát hiện gian lận thẻ tín dụng.
B. Dự báo thời tiết chính xác tuyệt đối trong dài hạn.
C. Nhận dạng khuôn mặt.
D. Gợi ý sản phẩm cho người dùng trên trang thương mại điện tử.
4. Phương pháp 'kiểm định chéo′ (cross-validation) được sử dụng với mục đích chính nào trong học máy?
A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khách quan hiệu suất của mô hình trên dữ liệu chưa từng thấy.
C. Giảm kích thước bộ dữ liệu huấn luyện.
D. Cải thiện khả năng diễn giải của mô hình.
5. Trong học máy, 'đường cong ROC′ (Receiver Operating Characteristic curve) được sử dụng để đánh giá hiệu suất của mô hình nào?
A. Mô hình hồi quy.
B. Mô hình phân cụm.
C. Mô hình phân loại nhị phân.
D. Mô hình giảm chiều dữ liệu.
6. Trong các loại hình học máy sau, loại nào sử dụng dữ liệu đã được gán nhãn để huấn luyện?
A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)
7. Phương pháp nào sau đây KHÔNG thuộc nhóm phương pháp 'học tập chuyển giao′ (transfer learning)?
A. Tinh chỉnh (Fine-tuning) mô hình tiền huấn luyện.
B. Huấn luyện mô hình từ đầu trên bộ dữ liệu mới.
C. Sử dụng mô hình tiền huấn luyện như một bộ trích xuất đặc trưng (feature extractor).
D. Đa nhiệm vụ học (Multi-task learning) khi có dữ liệu liên quan.
8. Thuật toán giảm chiều dữ liệu (dimensionality reduction) nào sau đây KHÔNG thuộc nhóm tuyến tính?
A. Phân tích thành phần chính (PCA - Principal Component Analysis)
B. Phân tích thành phần độc lập (ICA - Independent Component Analysis)
C. t-SNE (t-distributed Stochastic Neighbor Embedding)
D. Phân tích phân biệt tuyến tính (LDA - Linear Discriminant Analysis)
9. Khái niệm 'dropout′ trong mạng nơ-ron được sử dụng với mục đích chính nào?
A. Tăng tốc độ huấn luyện mạng.
B. Giảm hiện tượng quá khớp (overfitting) bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng số lượng tham số của mạng.
D. Cải thiện khả năng diễn giải của mạng.
10. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong học máy?
A. Chuẩn hóa Z-score.
B. Mã hóa one-hot (one-hot encoding) hoặc TF-IDF.
C. Phân tích thành phần chính (PCA).
D. K-Means clustering.
11. Thuật toán 'Naive Bayes′ dựa trên giả định quan trọng nào về các thuộc tính (features)?
A. Các thuộc tính phải có phân phối chuẩn.
B. Các thuộc tính phải độc lập với nhau.
C. Các thuộc tính phải có tương quan tuyến tính.
D. Các thuộc tính phải được chuẩn hóa về cùng một thang đo.
12. Khái niệm 'bias-variance tradeoff′ trong học máy mô tả sự đánh đổi giữa điều gì?
A. Độ chính xác và độ phức tạp của mô hình.
B. Sai số do giả định đơn giản hóa mô hình (bias) và sai số do mô hình quá nhạy cảm với dữ liệu huấn luyện (variance).
C. Thời gian huấn luyện và độ chính xác của mô hình.
D. Số lượng dữ liệu huấn luyện và hiệu suất của mô hình.
13. Phương pháp 'bagging′ (bootstrap aggregating) trong học máy hoạt động bằng cách nào?
A. Huấn luyện một mô hình duy nhất trên toàn bộ dữ liệu huấn luyện.
B. Huấn luyện nhiều mô hình độc lập trên các mẫu dữ liệu huấn luyện được lấy có hoàn lại, sau đó tổng hợp kết quả dự đoán.
C. Chia dữ liệu huấn luyện thành các phần nhỏ và huấn luyện mô hình tuần tự trên từng phần.
D. Lựa chọn ra một tập con các thuộc tính (features) quan trọng nhất để huấn luyện mô hình.
14. Trong mạng nơ-ron (neural network), hàm kích hoạt (activation function) có vai trò chính gì?
A. Tính toán độ lỗi (loss) của mô hình.
B. Giới thiệu tính phi tuyến vào mạng, cho phép mô hình học các quan hệ phức tạp hơn.
C. Khởi tạo trọng số (weights) của mạng.
D. Chuẩn hóa dữ liệu đầu vào.
15. Trong ngữ cảnh của mô hình học máy, 'độ phân giải′ (resolution) thường được sử dụng để mô tả đặc điểm của loại dữ liệu nào?
A. Dữ liệu văn bản.
B. Dữ liệu hình ảnh.
C. Dữ liệu chuỗi thời gian.
D. Dữ liệu dạng bảng.
16. Mục tiêu chính của việc 'chuẩn hóa dữ liệu′ (data normalization) trong tiền xử lý dữ liệu cho học máy là gì?
A. Tăng kích thước bộ dữ liệu huấn luyện.
B. Giảm số lượng thuộc tính (features) trong dữ liệu.
C. Đưa các thuộc tính về cùng một thang đo, tránh việc một số thuộc tính có giá trị lớn hơn ảnh hưởng quá mức đến mô hình.
D. Đảm bảo dữ liệu không chứa giá trị khuyết thiếu (missing values).
17. Độ đo nào sau đây KHÔNG được sử dụng để đánh giá hiệu suất của mô hình phân loại?
A. Độ chính xác (Accuracy)
B. F1-score
C. RMSE (Root Mean Squared Error)
D. Độ thu hồi (Recall)
18. Trong thuật toán K-Means, giá trị 'K′ đại diện cho điều gì?
A. Số lượng chiều dữ liệu.
B. Số lượng cụm (clusters) mong muốn.
C. Số lần lặp tối đa của thuật toán.
D. Kích thước của bộ dữ liệu.
19. Phương pháp 'boosting′ (ví dụ: AdaBoost, Gradient Boosting) khác với 'bagging′ (ví dụ: Random Forest) ở điểm nào?
A. Boosting huấn luyện các mô hình song song, trong khi bagging huấn luyện tuần tự.
B. Boosting huấn luyện các mô hình yếu (weak learners) một cách tuần tự, mỗi mô hình tập trung vào việc sửa lỗi của các mô hình trước đó, trong khi bagging huấn luyện các mô hình độc lập.
C. Boosting chỉ áp dụng cho bài toán phân loại, còn bagging chỉ áp dụng cho bài toán hồi quy.
D. Boosting ít bị quá khớp hơn bagging.
20. Ưu điểm chính của thuật toán 'Rừng ngẫu nhiên′ (Random Forest) so với 'Cây quyết định′ (Decision Tree) đơn lẻ là gì?
A. Rừng ngẫu nhiên dễ diễn giải hơn cây quyết định.
B. Rừng ngẫu nhiên ít bị quá khớp hơn và thường cho hiệu suất dự đoán tốt hơn cây quyết định.
C. Rừng ngẫu nhiên có tốc độ huấn luyện nhanh hơn cây quyết định.
D. Rừng ngẫu nhiên yêu cầu ít dữ liệu huấn luyện hơn cây quyết định.
21. Mục tiêu của việc sử dụng thuật toán 'Gradient Descent′ trong huấn luyện mô hình học máy là gì?
A. Tìm ra bộ siêu tham số (hyperparameters) tối ưu.
B. Tìm ra trọng số (weights) của mô hình sao cho hàm mất mát (loss function) đạt giá trị nhỏ nhất.
C. Giảm chiều dữ liệu huấn luyện.
D. Tăng kích thước bộ dữ liệu huấn luyện.
22. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán học có giám sát?
A. Cây quyết định (Decision Tree)
B. K-Means
C. Máy vectơ hỗ trợ (Support Vector Machine)
D. Hồi quy Logistic (Logistic Regression)
23. Thuật ngữ 'feature engineering′ trong học máy đề cập đến quá trình nào?
A. Lựa chọn thuật toán học máy phù hợp nhất cho bài toán.
B. Tối ưu hóa siêu tham số (hyperparameters) của mô hình.
C. Thiết kế và biến đổi các thuộc tính (features) đầu vào để cải thiện hiệu suất mô hình.
D. Triển khai mô hình học máy lên môi trường sản xuất.
24. Hiện tượng 'quá khớp′ (overfitting) trong học máy xảy ra khi nào?
A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
D. Mô hình không thể học được từ dữ liệu huấn luyện.
25. Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng quá khớp?
A. Tăng kích thước bộ dữ liệu huấn luyện.
B. Giảm độ phức tạp của mô hình (ví dụ: tỉa cây quyết định, giảm số lớp trong mạng nơ-ron).
C. Sử dụng nhiều thuộc tính (features) hơn.
D. Giảm số lần lặp huấn luyện (epochs).
26. Ma trận nhầm lẫn (confusion matrix) được sử dụng chủ yếu để đánh giá hiệu suất của mô hình học máy nào?
A. Mô hình hồi quy (Regression models)
B. Mô hình phân cụm (Clustering models)
C. Mô hình phân loại (Classification models)
D. Mô hình giảm chiều dữ liệu (Dimensionality reduction models)
27. Đâu là nhược điểm chính của thuật toán K-Nearest Neighbors (KNN)?
A. Khó diễn giải kết quả dự đoán.
B. Tốn nhiều bộ nhớ và thời gian dự đoán, đặc biệt với bộ dữ liệu lớn.
C. Không hiệu quả với dữ liệu nhiễu.
D. Chỉ hoạt động tốt với dữ liệu số.
28. Trong học sâu (Deep Learning), 'mạng nơ-ron tích chập′ (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong xử lý loại dữ liệu nào?
A. Dữ liệu văn bản.
B. Dữ liệu hình ảnh và video.
C. Dữ liệu chuỗi thời gian.
D. Dữ liệu dạng bảng.
29. Đâu là phát biểu ĐÚNG về Học máy?
A. Học máy là một nhánh của Trí tuệ Nhân tạo (AI) cho phép hệ thống tự học từ dữ liệu mà không cần được lập trình một cách rõ ràng.
B. Học máy chỉ giới hạn trong việc phân tích dữ liệu số và không thể xử lý dữ liệu phi cấu trúc như văn bản hoặc hình ảnh.
C. Học máy luôn đảm bảo đưa ra quyết định chính xác 100% trong mọi tình huống, bất kể chất lượng dữ liệu.
D. Học máy và Thống kê là hai lĩnh vực hoàn toàn tách biệt và không có sự giao thoa về phương pháp luận.
30. Trong học tăng cường (Reinforcement Learning), 'môi trường′ (environment) là gì?
A. Thuật toán học máy được sử dụng.
B. Bộ dữ liệu huấn luyện.
C. Thực thể mà tác nhân (agent) tương tác và hành động.
D. Mục tiêu mà tác nhân cần đạt được.