1. Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'word embedding′ (nhúng từ) có mục đích gì?
A. Phân tích cú pháp câu
B. Biểu diễn từ thành các vector số có nghĩa
C. Loại bỏ từ dừng (stop words)
D. Thực hiện dịch máy
2. Khi nào thì nên sử dụng 'Naive Bayes′ classifier?
A. Khi cần mô hình có độ chính xác cao nhất cho mọi loại dữ liệu
B. Khi dữ liệu có mối quan hệ phi tuyến phức tạp
C. Khi dữ liệu có số lượng lớn đặc trưng và cần tốc độ huấn luyện nhanh
D. Khi cần mô hình diễn giải tốt các mối quan hệ tương tác giữa các đặc trưng
3. Khi nào thì nên ưu tiên sử dụng mô hình 'Decision Tree′ thay vì các mô hình phức tạp hơn như Neural Network?
A. Khi cần độ chính xác dự đoán cao nhất tuyệt đối
B. Khi dữ liệu có kích thước rất lớn
C. Khi cần mô hình dễ diễn giải và hiểu được logic quyết định
D. Khi dữ liệu có nhiều chiều và phức tạp
4. Ưu điểm chính của thuật toán 'Ensemble Learning′ (học tập kết hợp) là gì?
A. Giảm thời gian huấn luyện mô hình
B. Tăng độ chính xác và độ ổn định của mô hình
C. Đơn giản hóa quá trình tiền xử lý dữ liệu
D. Cải thiện khả năng diễn giải mô hình
5. Thuật toán 'Apriori′ thường được sử dụng trong lĩnh vực nào của học máy?
A. Phân loại văn bản
B. Phân tích luật kết hợp (association rule mining)
C. Phân tích chuỗi thời gian
D. Phát hiện dị thường
6. Trong mô hình 'Support Vector Machine′ (SVM), 'kernel′ (hàm nhân) có vai trò gì?
A. Tối ưu hóa siêu phẳng phân tách (hyperplane)
B. Chuyển đổi dữ liệu sang không gian chiều cao hơn để phân tách tuyến tính
C. Giảm chiều dữ liệu đầu vào
D. Tính toán khoảng cách giữa các điểm dữ liệu
7. Kỹ thuật 'regularization′ (chính quy hóa) trong học máy nhằm mục đích chính là gì?
A. Tăng tốc độ huấn luyện mô hình
B. Giảm độ phức tạp của mô hình và tránh overfitting
C. Tăng độ chính xác trên dữ liệu huấn luyện
D. Cải thiện khả năng diễn giải của mô hình
8. Phương pháp 'dropout′ thường được sử dụng trong mạng nơ-ron để giải quyết vấn đề gì?
A. Vanishing gradients
B. Exploding gradients
C. Overfitting
D. Underfitting
9. Trong mạng nơ-ron tích chập (Convolutional Neural Network - CNN), lớp 'convolutional layer′ (lớp tích chập) có chức năng chính là gì?
A. Giảm chiều dữ liệu đầu vào
B. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào
C. Phân loại dữ liệu đầu vào
D. Tăng tính phi tuyến cho mạng
10. Khi mô hình học máy có 'high bias′ (độ chệch cao), điều này thường ngụ ý gì?
A. Mô hình overfitting dữ liệu huấn luyện
B. Mô hình underfitting dữ liệu huấn luyện
C. Mô hình có độ biến động cao
D. Mô hình khái quát hóa tốt trên dữ liệu mới
11. Kỹ thuật 'feature scaling′ (tỉ lệ hóa đặc trưng) thường được áp dụng trước khi huấn luyện mô hình nào sau đây?
A. Decision Tree
B. Random Forest
C. Support Vector Machine (SVM)
D. Naive Bayes
12. Trong bài toán 'regression′ (hồi quy), độ đo nào sau đây thường được sử dụng để đánh giá hiệu năng mô hình?
A. Accuracy
B. Precision
C. Mean Squared Error (MSE)
D. Recall
13. Điều gì xảy ra khi 'learning rate′ (tốc độ học) trong thuật toán gradient descent được đặt quá lớn?
A. Hội tụ nhanh hơn đến điểm tối ưu
B. Mô hình có thể không hội tụ hoặc dao động quanh điểm tối ưu
C. Mô hình bị overfitting
D. Thời gian huấn luyện giảm đáng kể
14. Phương pháp học máy nào sau đây thuộc nhóm 'học có giám sát′ (supervised learning)?
A. K-means clustering
B. Principal Component Analysis (PCA)
C. Linear Regression
D. Anomaly Detection
15. Trong mô hình 'Random Forest′, yếu tố 'random′ (ngẫu nhiên) được thể hiện ở khía cạnh nào?
A. Ngẫu nhiên chọn siêu tham số mô hình
B. Ngẫu nhiên chọn mẫu dữ liệu và tập hợp đặc trưng cho mỗi cây quyết định
C. Ngẫu nhiên khởi tạo trọng số của mô hình
D. Ngẫu nhiên chọn thuật toán cơ sở
16. Trong bài toán phân loại (classification), độ đo 'accuracy′ (độ chính xác) được tính như thế nào?
A. Tổng số dự đoán đúng chia cho tổng số mẫu
B. Tổng số dự đoán đúng chia cho tổng số dự đoán sai
C. Tổng số dự đoán sai chia cho tổng số mẫu
D. Trung bình cộng của precision và recall
17. Trong học tăng cường (Reinforcement Learning), 'reward function′ (hàm phần thưởng) xác định điều gì?
A. Hành động mà agent nên thực hiện
B. Trạng thái hiện tại của môi trường
C. Mục tiêu tối ưu hóa của agent
D. Xác suất chuyển trạng thái
18. Phương pháp 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình phát triển mô hình học máy?
A. Tăng kích thước tập dữ liệu huấn luyện
B. Ước lượng hiệu năng của mô hình trên dữ liệu unseen
C. Lựa chọn thuật toán học máy tốt nhất
D. Tối ưu hóa siêu tham số mô hình trên tập huấn luyện
19. Trong ngữ cảnh của mạng nơ-ron (neural network), hàm kích hoạt (activation function) có vai trò gì?
A. Tính toán độ chính xác của mô hình
B. Giới thiệu tính phi tuyến vào mạng
C. Khởi tạo trọng số của các kết nối
D. Chuẩn hóa dữ liệu đầu vào
20. Sự khác biệt chính giữa 'batch gradient descent′ và 'stochastic gradient descent′ (SGD) là gì?
A. Batch GD nhanh hơn SGD
B. SGD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi Batch GD chỉ dùng một mẫu
C. Batch GD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi SGD chỉ dùng một hoặc một nhóm nhỏ mẫu
D. SGD luôn hội tụ nhanh hơn Batch GD
21. Trong thuật toán 'Gradient Boosting′, các mô hình yếu (weak learners) thường là loại mô hình nào?
A. Neural Networks sâu
B. Decision Trees ngắn (shallow)
C. Support Vector Machines (SVM)
D. K-Nearest Neighbors (KNN)
22. Thuật toán nào sau đây thường được sử dụng cho bài toán giảm chiều dữ liệu (dimensionality reduction)?
A. Support Vector Machine (SVM)
B. K-Nearest Neighbors (KNN)
C. Principal Component Analysis (PCA)
D. Decision Tree
23. Kỹ thuật 'data augmentation′ (tăng cường dữ liệu) thường được sử dụng nhiều nhất trong lĩnh vực học máy nào?
A. Xử lý ngôn ngữ tự nhiên (NLP)
B. Thị giác máy tính (Computer Vision)
C. Học tăng cường (Reinforcement Learning)
D. Học không giám sát (Unsupervised Learning)
24. Phương pháp 'early stopping′ được sử dụng để làm gì trong quá trình huấn luyện mạng nơ-ron?
A. Tăng tốc độ hội tụ
B. Tránh overfitting bằng cách dừng huấn luyện khi hiệu năng trên tập validation không cải thiện
C. Khởi tạo trọng số mạng
D. Chuẩn hóa dữ liệu đầu vào
25. Trong mô hình 'Hidden Markov Model′ (HMM), trạng thái 'hidden′ (ẩn) có nghĩa là gì?
A. Trạng thái không quan trọng
B. Trạng thái không thể quan sát trực tiếp, chỉ có thể suy luận thông qua quan sát
C. Trạng thái được mã hóa
D. Trạng thái được khởi tạo ngẫu nhiên
26. Thuật toán nào sau đây thuộc nhóm 'clustering′ (phân cụm)?
A. Logistic Regression
B. Support Vector Regression (SVR)
C. DBSCAN
D. Naive Bayes Classifier
27. Trong học máy, 'bias-variance tradeoff′ (đánh đổi giữa bias và variance) mô tả mối quan hệ giữa điều gì?
A. Độ chính xác và tốc độ huấn luyện
B. Độ phức tạp của mô hình và khả năng khái quát hóa
C. Kích thước tập dữ liệu và độ chính xác
D. Số lượng đặc trưng và thời gian tiền xử lý
28. Trong bài toán phát hiện gian lận (fraud detection), độ đo nào sau đây thường quan trọng hơn 'accuracy′?
A. Precision và Recall
B. F1-score và AUC-ROC
C. Confusion matrix
D. Tất cả các đáp án trên
29. Trong học máy, thuật ngữ 'feature′ (đặc trưng) thường được dùng để chỉ điều gì?
A. Một thuật toán học máy cụ thể
B. Một siêu tham số của mô hình
C. Một thuộc tính hoặc cột dữ liệu đầu vào
D. Đầu ra dự đoán của mô hình
30. Trong thuật toán K-means clustering, giá trị 'K′ đại diện cho điều gì?
A. Số chiều của dữ liệu
B. Số lượng cụm (clusters) mong muốn
C. Số lần lặp tối đa của thuật toán
D. Hằng số học tập (learning rate)