1. Trong học sâu (deep learning), 'dropout′ là một kỹ thuật để:
A. Tăng tốc độ huấn luyện.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác trên dữ liệu huấn luyện.
D. Trực quan hóa các lớp ẩn.
2. Trong học máy, thuật ngữ 'gradient descent′ (gradient xuống dốc) đề cập đến điều gì?
A. Một phương pháp để đánh giá mô hình.
B. Một thuật toán tối ưu hóa để tìm cực tiểu của hàm mất mát.
C. Một kỹ thuật tiền xử lý dữ liệu.
D. Một loại mô hình học máy.
3. Trong bài toán phát hiện gian lận thẻ tín dụng, độ đo nào quan trọng hơn để tối ưu hóa: Precision hay Recall?
A. Precision quan trọng hơn.
B. Recall quan trọng hơn.
C. Cả Precision và Recall đều quan trọng như nhau.
D. Không có độ đo nào quan trọng trong trường hợp này.
4. Trong học máy, 'bias′ (độ lệch) và 'variance′ (phương sai) đề cập đến điều gì?
A. Hai loại lỗi trong dữ liệu huấn luyện.
B. Hai nguồn lỗi chính trong mô hình học máy.
C. Hai phương pháp để cải thiện độ chính xác của mô hình.
D. Hai loại thuật toán học máy khác nhau.
5. Trong học máy, 'feature scaling′ (tỉ lệ hóa đặc trưng) thường được thực hiện để:
A. Tăng độ chính xác của mô hình cây quyết định.
B. Đảm bảo các đặc trưng có đóng góp tương đương vào mô hình, đặc biệt là các mô hình dựa trên khoảng cách.
C. Giảm thời gian huấn luyện cho các mô hình tuyến tính.
D. Loại bỏ các đặc trưng không liên quan.
6. Hàm kích hoạt (activation function) nào thường được sử dụng trong lớp ẩn của mạng nơ-ron để giới thiệu tính phi tuyến?
A. Hàm tuyến tính (Linear function)
B. Hàm Sigmoid
C. Hàm đồng nhất (Identity function)
D. Hàm ngưỡng (Threshold function)
7. Phương pháp nào sau đây có thể giúp xử lý dữ liệu bị thiếu (missing data)?
A. Feature scaling
B. Imputation (điền giá trị)
C. Regularization
D. Dimensionality reduction
8. Điều gì xảy ra khi một mô hình học máy bị 'overfitting′?
A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
D. Mô hình không thể học được từ dữ liệu huấn luyện.
9. Kỹ thuật nào sau đây được sử dụng để giảm overfitting trong mô hình cây quyết định?
A. Tăng kích thước tập dữ liệu huấn luyện
B. Pruning (tỉa cây)
C. Sử dụng nhiều lớp ẩn hơn
D. Tăng tốc độ học (learning rate)
10. Trong lĩnh vực thị giác máy tính (computer vision), CNN là viết tắt của:
A. Computational Neural Network
B. Convolutional Neural Network
C. Connected Node Network
D. Complex Number Network
11. Đâu là phát biểu đúng nhất về Học máy (Machine Learning)?
A. Học máy là một nhánh của Trí tuệ nhân tạo (AI) tập trung vào việc tạo ra các chương trình máy tính có khả năng tự học từ dữ liệu mà không cần được lập trình một cách rõ ràng.
B. Học máy là quá trình mã hóa dữ liệu thành các thuật toán để máy tính có thể thực hiện các tác vụ cụ thể.
C. Học máy là việc sử dụng máy tính để mô phỏng trí thông minh của con người trong mọi lĩnh vực.
D. Học máy là một phương pháp thống kê truyền thống để phân tích dữ liệu.
12. Mục tiêu của 'hyperparameter tuning′ (điều chỉnh siêu tham số) là gì?
A. Huấn luyện mô hình trên tập dữ liệu lớn hơn.
B. Chọn các giá trị siêu tham số tối ưu cho mô hình để đạt hiệu suất tốt nhất.
C. Giảm overfitting bằng cách thay đổi kiến trúc mô hình.
D. Tăng tốc độ dự đoán của mô hình.
13. Trong học máy, 'label encoding′ và 'one-hot encoding′ được sử dụng để xử lý loại dữ liệu nào?
A. Dữ liệu số (numerical data).
B. Dữ liệu văn bản (text data).
C. Dữ liệu phạm trù (categorical data).
D. Dữ liệu thời gian (time series data).
14. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để đánh giá hiệu suất của mô hình nào?
A. Mô hình hồi quy.
B. Mô hình phân cụm.
C. Mô hình phân loại.
D. Mô hình giảm chiều dữ liệu.
15. Phương pháp nào sau đây thường được sử dụng để đánh giá mô hình hồi quy?
A. Accuracy
B. Precision
C. Mean Squared Error (MSE)
D. F1-score
16. Thuật toán nào sau đây dựa trên nguyên tắc 'lười biếng′ (lazy learning)?
A. Cây quyết định (Decision Tree)
B. K-Nearest Neighbors (KNN)
C. Naive Bayes
D. Mạng nơ-ron (Neural Network)
17. Mô hình học máy nào sau đây hoạt động tốt với dữ liệu phi tuyến tính?
A. Hồi quy tuyến tính (Linear Regression)
B. Máy vector hỗ trợ (Support Vector Machine) với kernel RBF
C. Hồi quy Logistic (Logistic Regression)
D. Naive Bayes
18. Loại học máy nào mà thuật toán được huấn luyện trên dữ liệu đã được gán nhãn (labeled data) để dự đoán nhãn cho dữ liệu mới?
A. Học tăng cường (Reinforcement Learning)
B. Học không giám sát (Unsupervised Learning)
C. Học bán giám sát (Semi-supervised Learning)
D. Học có giám sát (Supervised Learning)
19. Trong ngữ cảnh của mạng nơ-ron, 'backpropagation′ là thuật toán dùng để làm gì?
A. Dự đoán đầu ra cho dữ liệu mới.
B. Tính toán độ chính xác của mô hình.
C. Cập nhật trọng số của mạng để giảm thiểu lỗi.
D. Khởi tạo trọng số ban đầu của mạng.
20. Trong xử lý ngôn ngữ tự nhiên (NLP), TF-IDF là viết tắt của:
A. Term Frequency - Inverse Document Frequency
B. Text Feature - Inverse Data Feature
C. Training Feature - Important Data Feature
D. Topic Frequency - Index Document Frequency
21. Trong thuật toán K-Means, giá trị 'K′ đại diện cho điều gì?
A. Số lượng đặc trưng (features) trong dữ liệu.
B. Số lần lặp tối đa của thuật toán.
C. Số lượng cụm (clusters) mong muốn.
D. Kích thước của mỗi cụm.
22. Phương pháp nào sau đây KHÔNG phải là một phương pháp giảm chiều dữ liệu (dimensionality reduction)?
A. Principal Component Analysis (PCA)
B. Linear Discriminant Analysis (LDA)
C. K-Nearest Neighbors (KNN)
D. t-distributed Stochastic Neighbor Embedding (t-SNE)
23. Phương pháp 'ensemble learning′ (học kết hợp) nhằm mục đích gì?
A. Giảm số lượng đặc trưng đầu vào.
B. Kết hợp dự đoán của nhiều mô hình học máy để cải thiện hiệu suất tổng thể.
C. Tăng tốc độ huấn luyện của một mô hình duy nhất.
D. Đơn giản hóa cấu trúc của một mô hình phức tạp.
24. Mục tiêu chính của 'regularization′ (chính quy hóa) trong học máy là gì?
A. Tăng tốc độ huấn luyện mô hình.
B. Giảm overfitting và cải thiện khả năng khái quát hóa của mô hình.
C. Tăng độ chính xác trên dữ liệu huấn luyện.
D. Giảm kích thước của mô hình.
25. Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của học máy?
A. Dự báo thời tiết chính xác đến từng phút.
B. Hệ thống gợi ý sản phẩm trực tuyến.
C. Xe tự lái.
D. Phát hiện bệnh ung thư từ ảnh y tế.
26. Phương pháp nào sau đây thuộc về học không giám sát?
A. Cây quyết định (Decision Tree)
B. K-Means Clustering
C. Mạng nơ-ron tích chập (Convolutional Neural Network)
D. Hồi quy Logistic (Logistic Regression)
27. Đâu là một ví dụ về thuật toán học tăng cường?
A. Support Vector Machine (SVM)
B. Q-learning
C. Naive Bayes
D. Linear Regression
28. Trong bài toán phân loại (classification), độ đo nào thường được sử dụng để đánh giá hiệu suất của mô hình khi dữ liệu mất cân bằng (imbalanced data)?
A. Độ chính xác (Accuracy)
B. Độ đo F1 (F1-score)
C. Độ đo Recall
D. Độ đo Precision
29. Trong quá trình tiền xử lý dữ liệu văn bản, 'stemming′ và 'lemmatization′ là các kỹ thuật để làm gì?
A. Tăng cường dữ liệu văn bản.
B. Giảm chiều dữ liệu văn bản.
C. Chuẩn hóa từ về dạng gốc của chúng.
D. Phân loại văn bản theo chủ đề.
30. Kỹ thuật 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình phát triển mô hình học máy?
A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá khả năng khái quát hóa của mô hình và điều chỉnh siêu tham số.
C. Giảm thời gian huấn luyện mô hình.
D. Chọn thuật toán học máy tốt nhất.