Đề 13 - Bài tập, đề thi trắc nghiệm online Học máy

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!

Học máy

1. Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'word embedding′ (nhúng từ) có mục đích gì?

A. Phân tích cú pháp câu

B. Biểu diễn từ thành các vector số có nghĩa

C. Loại bỏ từ dừng (stop words)

D. Thực hiện dịch máy

2. Khi nào thì nên sử dụng 'Naive Bayes′ classifier?

A. Khi cần mô hình có độ chính xác cao nhất cho mọi loại dữ liệu

B. Khi dữ liệu có mối quan hệ phi tuyến phức tạp

C. Khi dữ liệu có số lượng lớn đặc trưng và cần tốc độ huấn luyện nhanh

D. Khi cần mô hình diễn giải tốt các mối quan hệ tương tác giữa các đặc trưng

3. Khi nào thì nên ưu tiên sử dụng mô hình 'Decision Tree′ thay vì các mô hình phức tạp hơn như Neural Network?

A. Khi cần độ chính xác dự đoán cao nhất tuyệt đối

B. Khi dữ liệu có kích thước rất lớn

C. Khi cần mô hình dễ diễn giải và hiểu được logic quyết định

D. Khi dữ liệu có nhiều chiều và phức tạp

4. Ưu điểm chính của thuật toán 'Ensemble Learning′ (học tập kết hợp) là gì?

A. Giảm thời gian huấn luyện mô hình

B. Tăng độ chính xác và độ ổn định của mô hình

C. Đơn giản hóa quá trình tiền xử lý dữ liệu

D. Cải thiện khả năng diễn giải mô hình

5. Thuật toán 'Apriori′ thường được sử dụng trong lĩnh vực nào của học máy?

A. Phân loại văn bản

B. Phân tích luật kết hợp (association rule mining)

C. Phân tích chuỗi thời gian

D. Phát hiện dị thường

6. Trong mô hình 'Support Vector Machine′ (SVM), 'kernel′ (hàm nhân) có vai trò gì?

A. Tối ưu hóa siêu phẳng phân tách (hyperplane)

B. Chuyển đổi dữ liệu sang không gian chiều cao hơn để phân tách tuyến tính

C. Giảm chiều dữ liệu đầu vào

D. Tính toán khoảng cách giữa các điểm dữ liệu

7. Kỹ thuật 'regularization′ (chính quy hóa) trong học máy nhằm mục đích chính là gì?

A. Tăng tốc độ huấn luyện mô hình

B. Giảm độ phức tạp của mô hình và tránh overfitting

C. Tăng độ chính xác trên dữ liệu huấn luyện

D. Cải thiện khả năng diễn giải của mô hình

8. Phương pháp 'dropout′ thường được sử dụng trong mạng nơ-ron để giải quyết vấn đề gì?

A. Vanishing gradients

B. Exploding gradients

C. Overfitting

D. Underfitting

9. Trong mạng nơ-ron tích chập (Convolutional Neural Network - CNN), lớp 'convolutional layer′ (lớp tích chập) có chức năng chính là gì?

A. Giảm chiều dữ liệu đầu vào

B. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào

C. Phân loại dữ liệu đầu vào

D. Tăng tính phi tuyến cho mạng

10. Khi mô hình học máy có 'high bias′ (độ chệch cao), điều này thường ngụ ý gì?

A. Mô hình overfitting dữ liệu huấn luyện

B. Mô hình underfitting dữ liệu huấn luyện

C. Mô hình có độ biến động cao

D. Mô hình khái quát hóa tốt trên dữ liệu mới

11. Kỹ thuật 'feature scaling′ (tỉ lệ hóa đặc trưng) thường được áp dụng trước khi huấn luyện mô hình nào sau đây?

A. Decision Tree

B. Random Forest

C. Support Vector Machine (SVM)

D. Naive Bayes

12. Trong bài toán 'regression′ (hồi quy), độ đo nào sau đây thường được sử dụng để đánh giá hiệu năng mô hình?

A. Accuracy

B. Precision

C. Mean Squared Error (MSE)

D. Recall

13. Điều gì xảy ra khi 'learning rate′ (tốc độ học) trong thuật toán gradient descent được đặt quá lớn?

A. Hội tụ nhanh hơn đến điểm tối ưu

B. Mô hình có thể không hội tụ hoặc dao động quanh điểm tối ưu

C. Mô hình bị overfitting

D. Thời gian huấn luyện giảm đáng kể

14. Phương pháp học máy nào sau đây thuộc nhóm 'học có giám sát′ (supervised learning)?

A. K-means clustering

B. Principal Component Analysis (PCA)

C. Linear Regression

D. Anomaly Detection

15. Trong mô hình 'Random Forest′, yếu tố 'random′ (ngẫu nhiên) được thể hiện ở khía cạnh nào?

A. Ngẫu nhiên chọn siêu tham số mô hình

B. Ngẫu nhiên chọn mẫu dữ liệu và tập hợp đặc trưng cho mỗi cây quyết định

C. Ngẫu nhiên khởi tạo trọng số của mô hình

D. Ngẫu nhiên chọn thuật toán cơ sở

16. Trong bài toán phân loại (classification), độ đo 'accuracy′ (độ chính xác) được tính như thế nào?

A. Tổng số dự đoán đúng chia cho tổng số mẫu

B. Tổng số dự đoán đúng chia cho tổng số dự đoán sai

C. Tổng số dự đoán sai chia cho tổng số mẫu

D. Trung bình cộng của precision và recall

17. Trong học tăng cường (Reinforcement Learning), 'reward function′ (hàm phần thưởng) xác định điều gì?

A. Hành động mà agent nên thực hiện

B. Trạng thái hiện tại của môi trường

C. Mục tiêu tối ưu hóa của agent

D. Xác suất chuyển trạng thái

18. Phương pháp 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình phát triển mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện

B. Ước lượng hiệu năng của mô hình trên dữ liệu unseen

C. Lựa chọn thuật toán học máy tốt nhất

D. Tối ưu hóa siêu tham số mô hình trên tập huấn luyện

19. Trong ngữ cảnh của mạng nơ-ron (neural network), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ chính xác của mô hình

B. Giới thiệu tính phi tuyến vào mạng

C. Khởi tạo trọng số của các kết nối

D. Chuẩn hóa dữ liệu đầu vào

20. Sự khác biệt chính giữa 'batch gradient descent′ và 'stochastic gradient descent′ (SGD) là gì?

A. Batch GD nhanh hơn SGD

B. SGD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi Batch GD chỉ dùng một mẫu

C. Batch GD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi SGD chỉ dùng một hoặc một nhóm nhỏ mẫu

D. SGD luôn hội tụ nhanh hơn Batch GD

21. Trong thuật toán 'Gradient Boosting′, các mô hình yếu (weak learners) thường là loại mô hình nào?

A. Neural Networks sâu

B. Decision Trees ngắn (shallow)

C. Support Vector Machines (SVM)

D. K-Nearest Neighbors (KNN)

22. Thuật toán nào sau đây thường được sử dụng cho bài toán giảm chiều dữ liệu (dimensionality reduction)?

A. Support Vector Machine (SVM)

B. K-Nearest Neighbors (KNN)

C. Principal Component Analysis (PCA)

D. Decision Tree

23. Kỹ thuật 'data augmentation′ (tăng cường dữ liệu) thường được sử dụng nhiều nhất trong lĩnh vực học máy nào?

A. Xử lý ngôn ngữ tự nhiên (NLP)

B. Thị giác máy tính (Computer Vision)

C. Học tăng cường (Reinforcement Learning)

D. Học không giám sát (Unsupervised Learning)

24. Phương pháp 'early stopping′ được sử dụng để làm gì trong quá trình huấn luyện mạng nơ-ron?

A. Tăng tốc độ hội tụ

B. Tránh overfitting bằng cách dừng huấn luyện khi hiệu năng trên tập validation không cải thiện

C. Khởi tạo trọng số mạng

D. Chuẩn hóa dữ liệu đầu vào

25. Trong mô hình 'Hidden Markov Model′ (HMM), trạng thái 'hidden′ (ẩn) có nghĩa là gì?

A. Trạng thái không quan trọng

B. Trạng thái không thể quan sát trực tiếp, chỉ có thể suy luận thông qua quan sát

C. Trạng thái được mã hóa

D. Trạng thái được khởi tạo ngẫu nhiên

26. Thuật toán nào sau đây thuộc nhóm 'clustering′ (phân cụm)?

A. Logistic Regression

B. Support Vector Regression (SVR)

C. DBSCAN

D. Naive Bayes Classifier

27. Trong học máy, 'bias-variance tradeoff′ (đánh đổi giữa bias và variance) mô tả mối quan hệ giữa điều gì?

A. Độ chính xác và tốc độ huấn luyện

B. Độ phức tạp của mô hình và khả năng khái quát hóa

C. Kích thước tập dữ liệu và độ chính xác

D. Số lượng đặc trưng và thời gian tiền xử lý

28. Trong bài toán phát hiện gian lận (fraud detection), độ đo nào sau đây thường quan trọng hơn 'accuracy′?

A. Precision và Recall

B. F1-score và AUC-ROC

C. Confusion matrix

D. Tất cả các đáp án trên

29. Trong học máy, thuật ngữ 'feature′ (đặc trưng) thường được dùng để chỉ điều gì?

A. Một thuật toán học máy cụ thể

B. Một siêu tham số của mô hình

C. Một thuộc tính hoặc cột dữ liệu đầu vào

D. Đầu ra dự đoán của mô hình

30. Trong thuật toán K-means clustering, giá trị 'K′ đại diện cho điều gì?

A. Số chiều của dữ liệu

B. Số lượng cụm (clusters) mong muốn

C. Số lần lặp tối đa của thuật toán

D. Hằng số học tập (learning rate)

1 / 30

Category: Học máy

Tags: Bộ đề 13

1. Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật `word embedding′ (nhúng từ) có mục đích gì?

A. Phân tích cú pháp câu

B. Biểu diễn từ thành các vector số có nghĩa

C. Loại bỏ từ dừng (stop words)

D. Thực hiện dịch máy

2 / 30

Category: Học máy

Tags: Bộ đề 13

2. Khi nào thì nên sử dụng `Naive Bayes′ classifier?

A. Khi cần mô hình có độ chính xác cao nhất cho mọi loại dữ liệu

B. Khi dữ liệu có mối quan hệ phi tuyến phức tạp

C. Khi dữ liệu có số lượng lớn đặc trưng và cần tốc độ huấn luyện nhanh

D. Khi cần mô hình diễn giải tốt các mối quan hệ tương tác giữa các đặc trưng

3 / 30

Category: Học máy

Tags: Bộ đề 13

3. Khi nào thì nên ưu tiên sử dụng mô hình `Decision Tree′ thay vì các mô hình phức tạp hơn như Neural Network?

A. Khi cần độ chính xác dự đoán cao nhất tuyệt đối

B. Khi dữ liệu có kích thước rất lớn

C. Khi cần mô hình dễ diễn giải và hiểu được logic quyết định

D. Khi dữ liệu có nhiều chiều và phức tạp

4 / 30

Category: Học máy

Tags: Bộ đề 13

4. Ưu điểm chính của thuật toán `Ensemble Learning′ (học tập kết hợp) là gì?

A. Giảm thời gian huấn luyện mô hình

B. Tăng độ chính xác và độ ổn định của mô hình

C. Đơn giản hóa quá trình tiền xử lý dữ liệu

D. Cải thiện khả năng diễn giải mô hình

5 / 30

Category: Học máy

Tags: Bộ đề 13

5. Thuật toán `Apriori′ thường được sử dụng trong lĩnh vực nào của học máy?

A. Phân loại văn bản

B. Phân tích luật kết hợp (association rule mining)

C. Phân tích chuỗi thời gian

D. Phát hiện dị thường

6 / 30

Category: Học máy

Tags: Bộ đề 13

6. Trong mô hình `Support Vector Machine′ (SVM), `kernel′ (hàm nhân) có vai trò gì?

A. Tối ưu hóa siêu phẳng phân tách (hyperplane)

B. Chuyển đổi dữ liệu sang không gian chiều cao hơn để phân tách tuyến tính

C. Giảm chiều dữ liệu đầu vào

D. Tính toán khoảng cách giữa các điểm dữ liệu

7 / 30

Category: Học máy

Tags: Bộ đề 13

7. Kỹ thuật `regularization′ (chính quy hóa) trong học máy nhằm mục đích chính là gì?

A. Tăng tốc độ huấn luyện mô hình

B. Giảm độ phức tạp của mô hình và tránh overfitting

C. Tăng độ chính xác trên dữ liệu huấn luyện

D. Cải thiện khả năng diễn giải của mô hình

8 / 30

Category: Học máy

Tags: Bộ đề 13

8. Phương pháp `dropout′ thường được sử dụng trong mạng nơ-ron để giải quyết vấn đề gì?

A. Vanishing gradients

B. Exploding gradients

C. Overfitting

D. Underfitting

9 / 30

Category: Học máy

Tags: Bộ đề 13

9. Trong mạng nơ-ron tích chập (Convolutional Neural Network - CNN), lớp `convolutional layer′ (lớp tích chập) có chức năng chính là gì?

A. Giảm chiều dữ liệu đầu vào

B. Trích xuất đặc trưng cục bộ từ dữ liệu đầu vào

C. Phân loại dữ liệu đầu vào

D. Tăng tính phi tuyến cho mạng

10 / 30

Category: Học máy

Tags: Bộ đề 13

10. Khi mô hình học máy có `high bias′ (độ chệch cao), điều này thường ngụ ý gì?

A. Mô hình overfitting dữ liệu huấn luyện

B. Mô hình underfitting dữ liệu huấn luyện

C. Mô hình có độ biến động cao

D. Mô hình khái quát hóa tốt trên dữ liệu mới

11 / 30

Category: Học máy

Tags: Bộ đề 13

11. Kỹ thuật `feature scaling′ (tỉ lệ hóa đặc trưng) thường được áp dụng trước khi huấn luyện mô hình nào sau đây?

A. Decision Tree

B. Random Forest

C. Support Vector Machine (SVM)

D. Naive Bayes

12 / 30

Category: Học máy

Tags: Bộ đề 13

12. Trong bài toán `regression′ (hồi quy), độ đo nào sau đây thường được sử dụng để đánh giá hiệu năng mô hình?

A. Accuracy

B. Precision

C. Mean Squared Error (MSE)

D. Recall

13 / 30

Category: Học máy

Tags: Bộ đề 13

13. Điều gì xảy ra khi `learning rate′ (tốc độ học) trong thuật toán gradient descent được đặt quá lớn?

A. Hội tụ nhanh hơn đến điểm tối ưu

B. Mô hình có thể không hội tụ hoặc dao động quanh điểm tối ưu

C. Mô hình bị overfitting

D. Thời gian huấn luyện giảm đáng kể

14 / 30

Category: Học máy

Tags: Bộ đề 13

14. Phương pháp học máy nào sau đây thuộc nhóm `học có giám sát′ (supervised learning)?

A. K-means clustering

B. Principal Component Analysis (PCA)

C. Linear Regression

D. Anomaly Detection

15 / 30

Category: Học máy

Tags: Bộ đề 13

15. Trong mô hình `Random Forest′, yếu tố `random′ (ngẫu nhiên) được thể hiện ở khía cạnh nào?

A. Ngẫu nhiên chọn siêu tham số mô hình

B. Ngẫu nhiên chọn mẫu dữ liệu và tập hợp đặc trưng cho mỗi cây quyết định

C. Ngẫu nhiên khởi tạo trọng số của mô hình

D. Ngẫu nhiên chọn thuật toán cơ sở

16 / 30

Category: Học máy

Tags: Bộ đề 13

16. Trong bài toán phân loại (classification), độ đo `accuracy′ (độ chính xác) được tính như thế nào?

A. Tổng số dự đoán đúng chia cho tổng số mẫu

B. Tổng số dự đoán đúng chia cho tổng số dự đoán sai

C. Tổng số dự đoán sai chia cho tổng số mẫu

D. Trung bình cộng của precision và recall

17 / 30

Category: Học máy

Tags: Bộ đề 13

17. Trong học tăng cường (Reinforcement Learning), `reward function′ (hàm phần thưởng) xác định điều gì?

A. Hành động mà agent nên thực hiện

B. Trạng thái hiện tại của môi trường

C. Mục tiêu tối ưu hóa của agent

D. Xác suất chuyển trạng thái

18 / 30

Category: Học máy

Tags: Bộ đề 13

18. Phương pháp `cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong quá trình phát triển mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện

B. Ước lượng hiệu năng của mô hình trên dữ liệu unseen

C. Lựa chọn thuật toán học máy tốt nhất

D. Tối ưu hóa siêu tham số mô hình trên tập huấn luyện

19 / 30

Category: Học máy

Tags: Bộ đề 13

19. Trong ngữ cảnh của mạng nơ-ron (neural network), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ chính xác của mô hình

B. Giới thiệu tính phi tuyến vào mạng

C. Khởi tạo trọng số của các kết nối

D. Chuẩn hóa dữ liệu đầu vào

20 / 30

Category: Học máy

Tags: Bộ đề 13

20. Sự khác biệt chính giữa `batch gradient descent′ và `stochastic gradient descent′ (SGD) là gì?

A. Batch GD nhanh hơn SGD

B. SGD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi Batch GD chỉ dùng một mẫu

C. Batch GD sử dụng toàn bộ tập dữ liệu huấn luyện trong mỗi lần cập nhật gradient, trong khi SGD chỉ dùng một hoặc một nhóm nhỏ mẫu

D. SGD luôn hội tụ nhanh hơn Batch GD

21 / 30

Category: Học máy

Tags: Bộ đề 13

21. Trong thuật toán `Gradient Boosting′, các mô hình yếu (weak learners) thường là loại mô hình nào?

A. Neural Networks sâu

B. Decision Trees ngắn (shallow)

C. Support Vector Machines (SVM)

D. K-Nearest Neighbors (KNN)

22 / 30

Category: Học máy

Tags: Bộ đề 13

22. Thuật toán nào sau đây thường được sử dụng cho bài toán giảm chiều dữ liệu (dimensionality reduction)?

A. Support Vector Machine (SVM)

B. K-Nearest Neighbors (KNN)

C. Principal Component Analysis (PCA)

D. Decision Tree

23 / 30

Category: Học máy

Tags: Bộ đề 13

23. Kỹ thuật `data augmentation′ (tăng cường dữ liệu) thường được sử dụng nhiều nhất trong lĩnh vực học máy nào?

A. Xử lý ngôn ngữ tự nhiên (NLP)

B. Thị giác máy tính (Computer Vision)

C. Học tăng cường (Reinforcement Learning)

D. Học không giám sát (Unsupervised Learning)

24 / 30

Category: Học máy

Tags: Bộ đề 13

24. Phương pháp `early stopping′ được sử dụng để làm gì trong quá trình huấn luyện mạng nơ-ron?

A. Tăng tốc độ hội tụ

B. Tránh overfitting bằng cách dừng huấn luyện khi hiệu năng trên tập validation không cải thiện

C. Khởi tạo trọng số mạng

D. Chuẩn hóa dữ liệu đầu vào

25 / 30

Category: Học máy

Tags: Bộ đề 13

25. Trong mô hình `Hidden Markov Model′ (HMM), trạng thái `hidden′ (ẩn) có nghĩa là gì?

A. Trạng thái không quan trọng

B. Trạng thái không thể quan sát trực tiếp, chỉ có thể suy luận thông qua quan sát

C. Trạng thái được mã hóa

D. Trạng thái được khởi tạo ngẫu nhiên

26 / 30

Category: Học máy

Tags: Bộ đề 13

26. Thuật toán nào sau đây thuộc nhóm `clustering′ (phân cụm)?

A. Logistic Regression

B. Support Vector Regression (SVR)

C. DBSCAN

D. Naive Bayes Classifier

27 / 30

Category: Học máy

Tags: Bộ đề 13

27. Trong học máy, `bias-variance tradeoff′ (đánh đổi giữa bias và variance) mô tả mối quan hệ giữa điều gì?

A. Độ chính xác và tốc độ huấn luyện

B. Độ phức tạp của mô hình và khả năng khái quát hóa

C. Kích thước tập dữ liệu và độ chính xác

D. Số lượng đặc trưng và thời gian tiền xử lý

28 / 30

Category: Học máy

Tags: Bộ đề 13

28. Trong bài toán phát hiện gian lận (fraud detection), độ đo nào sau đây thường quan trọng hơn `accuracy′?

A. Precision và Recall

B. F1-score và AUC-ROC

C. Confusion matrix

D. Tất cả các đáp án trên

29 / 30

Category: Học máy

Tags: Bộ đề 13

29. Trong học máy, thuật ngữ `feature′ (đặc trưng) thường được dùng để chỉ điều gì?

A. Một thuật toán học máy cụ thể

B. Một siêu tham số của mô hình

C. Một thuộc tính hoặc cột dữ liệu đầu vào

D. Đầu ra dự đoán của mô hình

30 / 30

Category: Học máy

Tags: Bộ đề 13

30. Trong thuật toán K-means clustering, giá trị `K′ đại diện cho điều gì?

A. Số chiều của dữ liệu

B. Số lượng cụm (clusters) mong muốn

C. Số lần lặp tối đa của thuật toán

D. Hằng số học tập (learning rate)

Xem kết quả

Nội dung liên quan: