1. Trong ngữ cảnh của 'Deep Learning′ (học sâu), điều gì làm nên sự 'sâu′ của mạng nơ-ron?
A. Số lượng tham số (trọng số) trong mạng.
B. Số lượng lớp ẩn (hidden layers) trong mạng.
C. Độ phức tạp của các hàm kích hoạt.
D. Kích thước của tập dữ liệu huấn luyện.
2. Loại học máy nào mà thuật toán được huấn luyện trên dữ liệu đã được gán nhãn?
A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)
3. Trong học máy, 'hyperparameter′ (siêu tham số) khác với 'parameter′ (tham số) ở điểm nào?
A. Siêu tham số được học từ dữ liệu, còn tham số do người dùng thiết lập.
B. Tham số được học từ dữ liệu, còn siêu tham số do người dùng thiết lập trước khi huấn luyện.
C. Siêu tham số ảnh hưởng đến tốc độ huấn luyện, còn tham số ảnh hưởng đến độ chính xác.
D. Tham số chỉ có trong mạng nơ-ron, còn siêu tham số có trong mọi thuật toán.
4. Thuật toán nào sau đây thường được sử dụng cho bài toán phân cụm (clustering)?
A. Logistic Regression
B. K-Means
C. Support Vector Machine (SVM)
D. Naive Bayes
5. Trong thuật toán K-Nearest Neighbors (KNN), tham số 'K′ đại diện cho điều gì?
A. Số lượng cụm (clusters) cần tìm.
B. Số chiều dữ liệu sau khi giảm chiều.
C. Số lượng hàng xóm gần nhất được xem xét để phân loại hoặc hồi quy.
D. Số lần lặp huấn luyện thuật toán.
6. Mục tiêu chính của 'regularization′ (chính quy hóa) trong học máy là gì?
A. Tăng tốc độ huấn luyện mô hình.
B. Giảm độ phức tạp của mô hình để tránh overfitting (quá khớp).
C. Cải thiện độ chính xác trên dữ liệu huấn luyện.
D. Tăng khả năng diễn giải của mô hình.
7. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong lĩnh vực nào?
A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
B. Dự đoán chuỗi thời gian (Time Series Forecasting).
C. Thị giác máy tính (Computer Vision - xử lý ảnh và video).
D. Hệ thống đề xuất (Recommendation Systems).
8. Khi nào thì nên sử dụng 'Logistic Regression′ thay vì 'Linear Regression′?
A. Khi muốn dự đoán giá trị liên tục.
B. Khi muốn phân loại dữ liệu vào hai hoặc nhiều lớp.
C. Khi dữ liệu có mối quan hệ tuyến tính mạnh.
D. Khi cần một mô hình có khả năng diễn giải cao.
9. Trong mô hình hồi quy tuyến tính (Linear Regression), 'loss function′ (hàm mất mát) thường được sử dụng là gì?
A. Cross-Entropy Loss
B. Hinge Loss
C. Mean Squared Error (MSE)
D. Categorical Cross-Entropy Loss
10. Thuật toán 'Gradient Descent′ được sử dụng để làm gì trong huấn luyện mô hình học máy?
A. Đánh giá hiệu suất của mô hình.
B. Tìm giá trị tối ưu của tham số mô hình để giảm thiểu hàm mất mát.
C. Tiền xử lý dữ liệu đầu vào.
D. Chọn đặc trưng phù hợp cho mô hình.
11. Mục tiêu của 'backpropagation′ (lan truyền ngược) trong mạng nơ-ron là gì?
A. Khởi tạo trọng số ban đầu cho mạng.
B. Tính toán độ chính xác của mô hình.
C. Cập nhật trọng số của mạng để giảm thiểu lỗi dự đoán.
D. Chọn hàm kích hoạt phù hợp.
12. Phương pháp nào sau đây KHÔNG thuộc về học không giám sát?
A. Phân cụm (Clustering)
B. Giảm chiều dữ liệu (Dimensionality Reduction)
C. Hồi quy tuyến tính (Linear Regression)
D. Phân tích thành phần chính (Principal Component Analysis - PCA)
13. Trong học máy, 'feature′ (đặc trưng) đề cập đến điều gì?
A. Thuật toán học máy được sử dụng.
B. Một thuộc tính hoặc biến đầu vào được sử dụng để huấn luyện mô hình.
C. Kết quả dự đoán của mô hình.
D. Phương pháp đánh giá hiệu suất mô hình.
14. Trong bài toán phân loại đa lớp (multi-class classification), độ đo 'Confusion Matrix′ (ma trận nhầm lẫn) cung cấp thông tin gì?
A. Độ chính xác tổng thể của mô hình.
B. Tỷ lệ dự đoán đúng cho mỗi lớp và các lỗi phân loại giữa các lớp.
C. Giá trị trung bình của các độ đo Precision và Recall.
D. Diện tích dưới đường cong ROC (AUC-ROC).
15. Học máy (Machine Learning) được định nghĩa chính xác nhất là gì?
A. Một lĩnh vực của khoa học máy tính cho phép máy tính lập trình rõ ràng để thực hiện các nhiệm vụ cụ thể.
B. Một lĩnh vực của khoa học máy tính cho phép máy tính học hỏi từ dữ liệu mà không cần được lập trình rõ ràng.
C. Một phương pháp thống kê để phân tích dữ liệu và đưa ra dự đoán.
D. Một công cụ phần mềm giúp tự động hóa các tác vụ phân tích dữ liệu.
16. Khi nào thì nên ưu tiên sử dụng thuật toán Random Forest thay vì một Decision Tree đơn lẻ?
A. Khi cần một mô hình dễ diễn giải và trực quan.
B. Khi dữ liệu có ít đặc trưng và kích thước nhỏ.
C. Khi muốn giảm overfitting và tăng độ chính xác dự đoán.
D. Khi yêu cầu thời gian huấn luyện mô hình nhanh chóng.
17. Mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) phù hợp nhất cho loại dữ liệu nào?
A. Dữ liệu dạng bảng (tabular data).
B. Dữ liệu ảnh tĩnh (static images).
C. Dữ liệu chuỗi (sequential data) như văn bản hoặc chuỗi thời gian.
D. Dữ liệu không có cấu trúc (unstructured data).
18. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?
A. Phát hiện gian lận trong giao dịch tài chính.
B. Dự báo thời tiết chính xác tuyệt đối trong dài hạn.
C. Nhận dạng khuôn mặt và đối tượng trong ảnh.
D. Đề xuất sản phẩm cho người dùng trực tuyến.
19. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?
A. Mean Squared Error (MSE)
B. R-squared
C. Accuracy (Độ chính xác)
D. Root Mean Squared Error (RMSE)
20. Kỹ thuật 'dropout′ trong mạng nơ-ron được sử dụng để làm gì?
A. Tăng tốc độ huấn luyện mạng.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Cải thiện khả năng diễn giải của mạng.
D. Chọn ra các đặc trưng quan trọng nhất trong dữ liệu.
21. Phương pháp nào sau đây giúp giải quyết vấn đề 'vanishing gradient′ (gradient biến mất) trong mạng nơ-ron sâu?
A. Sử dụng hàm kích hoạt ReLU.
B. Tăng số lượng lớp trong mạng.
C. Sử dụng thuật toán Gradient Descent thông thường.
D. Giảm kích thước batch size.
22. Hiện tượng 'overfitting′ (quá khớp) trong học máy xảy ra khi nào?
A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu kiểm tra nhưng kém trên dữ liệu huấn luyện.
C. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
23. Mục đích của 'feature scaling′ (tỉ lệ hóa đặc trưng) trong tiền xử lý dữ liệu học máy là gì?
A. Tăng số lượng đặc trưng của dữ liệu.
B. Đảm bảo các đặc trưng có cùng phạm vi giá trị, giúp các thuật toán hoạt động hiệu quả hơn.
C. Giảm nhiễu trong dữ liệu.
D. Chọn ra các đặc trưng quan trọng nhất.
24. Phương pháp nào sau đây KHÔNG phải là một kỹ thuật ensemble (tổng hợp mô hình)?
A. Bagging (Bootstrap Aggregating)
B. Boosting
C. Stacking
D. K-Means Clustering
25. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong học máy?
A. Principal Component Analysis (PCA).
B. K-Means Clustering.
C. Term Frequency-Inverse Document Frequency (TF-IDF).
D. Linear Regression.
26. Kỹ thuật 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong học máy?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu chưa từng thấy.
C. Chọn thuật toán học máy tốt nhất cho bài toán.
D. Giảm thời gian huấn luyện mô hình.
27. Trong ngữ cảnh của mạng nơ-ron (Neural Networks), 'activation function′ (hàm kích hoạt) có vai trò gì?
A. Tính toán độ lỗi của mô hình.
B. Đưa yếu tố phi tuyến tính vào mạng.
C. Tối ưu hóa trọng số của mạng.
D. Khởi tạo giá trị ban đầu cho các nơ-ron.
28. Thuật toán nào sau đây là một ví dụ của học tăng cường (Reinforcement Learning)?
A. K-Means Clustering
B. Q-Learning
C. Support Vector Machine (SVM)
D. Decision Tree
29. Phương pháp giảm chiều dữ liệu nào giữ lại các chiều dữ liệu có phương sai lớn nhất?
A. Linear Discriminant Analysis (LDA)
B. Principal Component Analysis (PCA)
C. Independent Component Analysis (ICA)
D. t-distributed Stochastic Neighbor Embedding (t-SNE)
30. Khái niệm 'bias-variance tradeoff′ (đánh đổi giữa bias và variance) trong học máy nói về điều gì?
A. Sự đánh đổi giữa độ chính xác trên dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Sự đánh đổi giữa khả năng diễn giải của mô hình và độ phức tạp của nó.
C. Sự đánh đổi giữa việc mô hình quá đơn giản (high bias) và quá phức tạp (high variance).
D. Sự đánh đổi giữa thời gian huấn luyện và độ chính xác của mô hình.