Đề 1 – Bài tập, đề thi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 1 - Bài tập, đề thi trắc nghiệm online Học máy

1. Trong học sâu (Deep Learning), mạng nơ-ron tích chập (Convolutional Neural Network - CNN) thường được sử dụng cho tác vụ nào?

A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
B. Nhận dạng hình ảnh (Image Recognition).
C. Dự báo chuỗi thời gian (Time Series Forecasting).
D. Học tăng cường (Reinforcement Learning).

2. Trong học máy, 'precision′ (độ chính xác) và 'recall′ (độ phủ) là gì?

A. Hai độ đo đánh giá hiệu suất của mô hình hồi quy.
B. Hai độ đo đánh giá hiệu suất của mô hình phân loại, trong đó precision đo tỷ lệ dự đoán dương tính đúng và recall đo tỷ lệ mẫu dương tính thực tế được phát hiện đúng.
C. Hai phương pháp giảm chiều dữ liệu.
D. Hai kỹ thuật regularization.

3. Phương pháp nào sau đây là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction)?

A. One-hot encoding.
B. Principal Component Analysis (PCA).
C. Feature scaling.
D. Cross-validation.

4. Trong học máy, 'regularization′ (chính quy hóa) có mục đích chính là gì?

A. Tăng độ chính xác của mô hình trên dữ liệu huấn luyện.
B. Giảm overfitting và cải thiện khả năng tổng quát hóa của mô hình.
C. Tăng tốc độ huấn luyện mô hình.
D. Chọn đặc trưng quan trọng nhất.

5. Phương pháp nào sau đây thuộc về học không giám sát (unsupervised learning)?

A. Hồi quy tuyến tính (Linear Regression).
B. Phân cụm K-means (K-means Clustering).
C. Máy vector hỗ trợ (Support Vector Machine).
D. Rừng ngẫu nhiên (Random Forest).

6. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

A. Sai số bình phương trung bình (Mean Squared Error).
B. Độ chính xác (Accuracy).
C. Giá trị trung bình (Mean).
D. Phương sai (Variance).

7. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?

A. Chọn đặc trưng quan trọng nhất.
B. Tìm giá trị tối ưu của tham số mô hình bằng cách đi theo hướng ngược gradient của hàm mất mát.
C. Đánh giá hiệu suất của mô hình.
D. Phân cụm dữ liệu.

8. AUC (Area Under the ROC Curve) là gì?

A. Diện tích dưới đường cong Precision-Recall.
B. Diện tích dưới đường cong ROC, thể hiện khả năng phân loại tổng thể của mô hình.
C. Một độ đo đánh giá độ chính xác của mô hình hồi quy.
D. Một phương pháp giảm chiều dữ liệu.

9. Đâu là mục tiêu chính của việc sử dụng tập dữ liệu kiểm tra (test dataset) trong học máy?

A. Huấn luyện mô hình học máy.
B. Tinh chỉnh các siêu tham số của mô hình.
C. Đánh giá hiệu suất của mô hình trên dữ liệu chưa từng thấy.
D. Lựa chọn thuật toán học máy tốt nhất.

10. Trong học máy, 'bias-variance tradeoff′ (đánh đổi giữa độ chệch và phương sai) đề cập đến điều gì?

A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác mô hình.
B. Sự đánh đổi giữa độ phức tạp của mô hình và khả năng tổng quát hóa.
C. Sự đánh đổi giữa kích thước tập dữ liệu huấn luyện và tập kiểm tra.
D. Sự đánh đổi giữa các thuật toán học máy khác nhau.

11. Trong học sâu, 'batch normalization′ (chuẩn hóa theo lô) có lợi ích gì?

A. Tăng độ chính xác trên dữ liệu huấn luyện.
B. Ổn định và tăng tốc độ huấn luyện mạng nơ-ron sâu bằng cách chuẩn hóa đầu ra của các lớp.
C. Giảm overfitting.
D. Giảm số lượng tham số mô hình.

12. Mạng nơ-ron RNN (Recurrent Neural Network) thường được sử dụng hiệu quả nhất cho loại dữ liệu nào?

A. Dữ liệu hình ảnh tĩnh.
B. Dữ liệu dạng chuỗi (sequential data) như văn bản hoặc chuỗi thời gian.
C. Dữ liệu dạng bảng.
D. Dữ liệu không có cấu trúc.

13. Mục đích của việc sử dụng 'validation set′ (tập kiểm chứng) trong quá trình huấn luyện mô hình học máy là gì?

A. Đánh giá hiệu suất cuối cùng của mô hình.
B. Huấn luyện mô hình.
C. Tinh chỉnh siêu tham số mô hình và lựa chọn mô hình tốt nhất trong quá trình huấn luyện.
D. Chuẩn bị dữ liệu đầu vào.

14. Trong học máy, 'label encoding′ và 'one-hot encoding′ dùng để làm gì?

A. Giảm chiều dữ liệu.
B. Chuyển đổi dữ liệuCategorical (danh mục) thành dạng số để mô hình học máy có thể xử lý.
C. Tỷ lệ hóa đặc trưng.
D. Đánh giá hiệu suất mô hình.

15. Trong ngữ cảnh của học máy, 'overfitting′ (quá khớp) xảy ra khi nào?

A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
D. Mô hình chưa được huấn luyện đầy đủ.

16. Phương pháp nào sau đây thường được sử dụng để giảm overfitting trong mô hình học máy?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Tăng độ phức tạp của mô hình.
C. Giảm số lượng đặc trưng đầu vào.
D. Sử dụng dữ liệu huấn luyện ít hơn.

17. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình hồi quy.
B. Đánh giá hiệu suất của mô hình phân cụm.
C. Đánh giá hiệu suất của mô hình phân loại nhị phân ở các ngưỡng phân loại khác nhau.
D. Giảm chiều dữ liệu.

18. Kỹ thuật 'dropout′ trong mạng nơ-ron được sử dụng để làm gì?

A. Tăng tốc độ huấn luyện mô hình.
B. Giảm overfitting bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Tăng độ chính xác của mô hình trên dữ liệu huấn luyện.
D. Khởi tạo trọng số của mạng nơ-ron.

19. Trong học máy, 'hyperparameter tuning′ (tinh chỉnh siêu tham số) là quá trình gì?

A. Huấn luyện mô hình trên tập dữ liệu lớn.
B. Chọn các giá trị tối ưu cho các tham số của thuật toán học máy không được học trực tiếp từ dữ liệu.
C. Chọn đặc trưng quan trọng nhất.
D. Đánh giá hiệu suất mô hình.

20. Kỹ thuật 'early stopping′ (dừng sớm) được sử dụng để làm gì trong quá trình huấn luyện mạng nơ-ron?

A. Tăng tốc độ huấn luyện.
B. Ngăn chặn overfitting bằng cách dừng huấn luyện khi hiệu suất trên tập kiểm chứng không còn cải thiện.
C. Tăng độ chính xác trên tập huấn luyện.
D. Khởi tạo trọng số mạng nơ-ron.

21. Ma trận nhầm lẫn (confusion matrix) thường được sử dụng để đánh giá hiệu suất của mô hình nào?

A. Mô hình hồi quy.
B. Mô hình phân cụm.
C. Mô hình phân loại.
D. Mô hình giảm chiều dữ liệu.

22. Trong học máy, thuật ngữ 'học có giám sát′ (supervised learning) ám chỉ điều gì?

A. Mô hình học từ dữ liệu không có nhãn.
B. Mô hình học từ dữ liệu có nhãn, trong đó mỗi mẫu dữ liệu được gán một nhãn hoặc kết quả mong muốn.
C. Mô hình học cách khám phá cấu trúc ẩn trong dữ liệu.
D. Mô hình học cách tương tác với môi trường để tối đa hóa phần thưởng.

23. Trong xử lý ngôn ngữ tự nhiên (NLP), TF-IDF được sử dụng để làm gì?

A. Phân tích cảm xúc văn bản.
B. Đo lường tầm quan trọng của từ trong một văn bản so với tập hợp văn bản.
C. Dịch máy.
D. Tóm tắt văn bản.

24. Khái niệm 'ensemble learning′ (học tập hợp) trong học máy là gì?

A. Huấn luyện một mô hình duy nhất trên nhiều tập dữ liệu khác nhau.
B. Kết hợp dự đoán của nhiều mô hình học máy khác nhau để cải thiện hiệu suất tổng thể.
C. Chia nhỏ tập dữ liệu huấn luyện thành nhiều phần nhỏ hơn.
D. Sử dụng nhiều thuật toán tối ưu hóa khác nhau.

25. Kỹ thuật 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá một cách đáng tin cậy hiệu suất của mô hình và giảm sự thiên vị do phân chia dữ liệu huấn luyện-kiểm tra.
C. Giảm overfitting.
D. Tăng tốc độ huấn luyện.

26. Đâu là một ví dụ về thuật toán học tăng cường (reinforcement learning)?

A. Naive Bayes.
B. Q-learning.
C. K-Nearest Neighbors (KNN).
D. Decision Tree.

27. Trong học máy, 'feature scaling′ (tỷ lệ hóa đặc trưng) thường được thực hiện để:

A. Tăng số lượng đặc trưng đầu vào.
B. Đảm bảo các đặc trưng có cùng phạm vi giá trị, giúp các thuật toán hội tụ nhanh hơn.
C. Giảm kích thước tập dữ liệu.
D. Lựa chọn đặc trưng quan trọng nhất.

28. Hàm kích hoạt ReLU (Rectified Linear Unit) trong mạng nơ-ron có đặc điểm gì?

A. Luôn cho ra giá trị trong khoảng từ 0 đến 1.
B. Xuất ra 0 nếu đầu vào âm và giữ nguyên giá trị đầu vào nếu dương.
C. Là một hàm tuyến tính.
D. Dẫn đến hiện tượng vanishing gradient (mất đạo hàm) trong quá trình huấn luyện.

29. Mô hình học máy nào sau đây có thể được sử dụng cho cả bài toán phân loại và hồi quy?

A. Naive Bayes.
B. K-Means Clustering.
C. Decision Tree.
D. Linear Regression.

30. Phương pháp 'boosting′ trong ensemble learning hoạt động như thế nào?

A. Huấn luyện song song nhiều mô hình độc lập.
B. Huấn luyện tuần tự các mô hình, trong đó mỗi mô hình tập trung vào việc sửa lỗi của các mô hình trước đó.
C. Lấy trung bình dự đoán của tất cả các mô hình.
D. Chọn mô hình tốt nhất từ một tập hợp các mô hình.

1 / 30

Category: Học máy

Tags: Bộ đề 1

1. Trong học sâu (Deep Learning), mạng nơ-ron tích chập (Convolutional Neural Network - CNN) thường được sử dụng cho tác vụ nào?

2 / 30

Category: Học máy

Tags: Bộ đề 1

2. Trong học máy, `precision′ (độ chính xác) và `recall′ (độ phủ) là gì?

3 / 30

Category: Học máy

Tags: Bộ đề 1

3. Phương pháp nào sau đây là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction)?

4 / 30

Category: Học máy

Tags: Bộ đề 1

4. Trong học máy, `regularization′ (chính quy hóa) có mục đích chính là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 1

5. Phương pháp nào sau đây thuộc về học không giám sát (unsupervised learning)?

6 / 30

Category: Học máy

Tags: Bộ đề 1

6. Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân loại?

7 / 30

Category: Học máy

Tags: Bộ đề 1

7. Thuật toán Gradient Descent được sử dụng để làm gì trong học máy?

8 / 30

Category: Học máy

Tags: Bộ đề 1

8. AUC (Area Under the ROC Curve) là gì?

9 / 30

Category: Học máy

Tags: Bộ đề 1

9. Đâu là mục tiêu chính của việc sử dụng tập dữ liệu kiểm tra (test dataset) trong học máy?

10 / 30

Category: Học máy

Tags: Bộ đề 1

10. Trong học máy, `bias-variance tradeoff′ (đánh đổi giữa độ chệch và phương sai) đề cập đến điều gì?

11 / 30

Category: Học máy

Tags: Bộ đề 1

11. Trong học sâu, `batch normalization′ (chuẩn hóa theo lô) có lợi ích gì?

12 / 30

Category: Học máy

Tags: Bộ đề 1

12. Mạng nơ-ron RNN (Recurrent Neural Network) thường được sử dụng hiệu quả nhất cho loại dữ liệu nào?

13 / 30

Category: Học máy

Tags: Bộ đề 1

13. Mục đích của việc sử dụng `validation set′ (tập kiểm chứng) trong quá trình huấn luyện mô hình học máy là gì?

14 / 30

Category: Học máy

Tags: Bộ đề 1

14. Trong học máy, `label encoding′ và `one-hot encoding′ dùng để làm gì?

15 / 30

Category: Học máy

Tags: Bộ đề 1

15. Trong ngữ cảnh của học máy, `overfitting′ (quá khớp) xảy ra khi nào?

16 / 30

Category: Học máy

Tags: Bộ đề 1

16. Phương pháp nào sau đây thường được sử dụng để giảm overfitting trong mô hình học máy?

17 / 30

Category: Học máy

Tags: Bộ đề 1

17. Đường cong ROC (Receiver Operating Characteristic) được sử dụng để làm gì?

18 / 30

Category: Học máy

Tags: Bộ đề 1

18. Kỹ thuật `dropout′ trong mạng nơ-ron được sử dụng để làm gì?

19 / 30

Category: Học máy

Tags: Bộ đề 1

19. Trong học máy, `hyperparameter tuning′ (tinh chỉnh siêu tham số) là quá trình gì?

20 / 30

Category: Học máy

Tags: Bộ đề 1

20. Kỹ thuật `early stopping′ (dừng sớm) được sử dụng để làm gì trong quá trình huấn luyện mạng nơ-ron?

21 / 30

Category: Học máy

Tags: Bộ đề 1

21. Ma trận nhầm lẫn (confusion matrix) thường được sử dụng để đánh giá hiệu suất của mô hình nào?

22 / 30

Category: Học máy

Tags: Bộ đề 1

22. Trong học máy, thuật ngữ `học có giám sát′ (supervised learning) ám chỉ điều gì?

23 / 30

Category: Học máy

Tags: Bộ đề 1

23. Trong xử lý ngôn ngữ tự nhiên (NLP), TF-IDF được sử dụng để làm gì?

24 / 30

Category: Học máy

Tags: Bộ đề 1

24. Khái niệm `ensemble learning′ (học tập hợp) trong học máy là gì?

25 / 30

Category: Học máy

Tags: Bộ đề 1

25. Kỹ thuật `cross-validation′ (kiểm định chéo) được sử dụng để làm gì?

26 / 30

Category: Học máy

Tags: Bộ đề 1

26. Đâu là một ví dụ về thuật toán học tăng cường (reinforcement learning)?

27 / 30

Category: Học máy

Tags: Bộ đề 1

27. Trong học máy, `feature scaling′ (tỷ lệ hóa đặc trưng) thường được thực hiện để:

28 / 30

Category: Học máy

Tags: Bộ đề 1

28. Hàm kích hoạt ReLU (Rectified Linear Unit) trong mạng nơ-ron có đặc điểm gì?

29 / 30

Category: Học máy

Tags: Bộ đề 1

29. Mô hình học máy nào sau đây có thể được sử dụng cho cả bài toán phân loại và hồi quy?

30 / 30

Category: Học máy

Tags: Bộ đề 1

30. Phương pháp `boosting′ trong ensemble learning hoạt động như thế nào?