Đề 8 – Bài tập, đề thi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 8 - Bài tập, đề thi trắc nghiệm online Học máy

1. Phân biệt 'online learning′ (học trực tuyến) và 'batch learning′ (học theo lô).

A. Online learning chỉ dùng cho dữ liệu trực tuyến, batch learning chỉ dùng cho dữ liệu tĩnh.
B. Online learning cập nhật mô hình liên tục khi có dữ liệu mới đến, batch learning huấn luyện trên toàn bộ dữ liệu một lần.
C. Online learning luôn nhanh hơn batch learning.
D. Batch learning cho kết quả chính xác hơn online learning.

2. Trong mạng nơ-ron (Neural Network), 'activation function′ (hàm kích hoạt) có vai trò gì?

A. Tối ưu hóa trọng số mạng.
B. Giới thiệu tính phi tuyến vào mạng, cho phép mô hình học các mối quan hệ phức tạp.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tính toán độ chính xác của mạng.

3. Phương pháp 'cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong học máy?

A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khả năng tổng quát hóa của mô hình và lựa chọn mô hình tốt nhất.
C. Giảm kích thước dữ liệu huấn luyện.
D. Cải thiện độ chính xác của dữ liệu đầu vào.

4. Metric 'F1-score′ là trung bình điều hòa của hai độ đo nào?

A. Accuracy và Precision.
B. Precision và Recall.
C. Recall và Specificity.
D. Accuracy và Recall.

5. Thuật toán 'Gradient Descent′ được sử dụng để làm gì trong huấn luyện mô hình học máy?

A. Chọn đặc trưng quan trọng nhất.
B. Tìm cực tiểu của hàm mất mát để tối ưu hóa tham số mô hình.
C. Phân cụm dữ liệu huấn luyện.
D. Đánh giá hiệu suất mô hình.

6. SVM (Support Vector Machine) hoạt động tốt nhất trong trường hợp nào?

A. Dữ liệu có chiều cao và số lượng mẫu lớn.
B. Dữ liệu phi tuyến tính và có biên quyết định phức tạp.
C. Dữ liệu tuyến tính và có biên quyết định rõ ràng.
D. Dữ liệu chứa nhiều nhiễu và ngoại lệ.

7. Ưu điểm chính của phương pháp học máy 'transfer learning′ (học chuyển giao) là gì?

A. Luôn cho kết quả chính xác hơn học từ đầu.
B. Có thể sử dụng mô hình đã được huấn luyện trên một nhiệm vụ để cải thiện hiệu suất trên một nhiệm vụ liên quan khác, đặc biệt khi dữ liệu cho nhiệm vụ mới hạn chế.
C. Giảm độ phức tạp của mô hình.
D. Không cần dữ liệu huấn luyện.

8. Học máy, về bản chất, là gì?

A. Lập trình rõ ràng các quy tắc để máy tính tuân theo.
B. Khả năng máy tính học hỏi từ dữ liệu mà không cần được lập trình явно.
C. Viết mã lệnh phức tạp để giải quyết các bài toán cụ thể.
D. Sử dụng các thuật toán thống kê để mô tả dữ liệu.

9. Một trong những thách thức đạo đức lớn nhất trong học máy là gì?

A. Tốc độ tính toán chậm.
B. Thiếu dữ liệu huấn luyện.
C. Thiên vị trong dữ liệu và thuật toán, dẫn đến quyết định không công bằng.
D. Khó khăn trong việc triển khai mô hình.

10. NLP (Xử lý ngôn ngữ tự nhiên) là lĩnh vực học máy tập trung vào điều gì?

A. Phân tích hình ảnh và video.
B. Hiểu và tạo ra ngôn ngữ của con người.
C. Dự đoán chuỗi thời gian.
D. Phân cụm dữ liệu số.

11. Hệ thống khuyến nghị (Recommender System) sử dụng học máy để làm gì?

A. Phân tích cảm xúc văn bản.
B. Dự đoán hành vi và sở thích của người dùng để đề xuất sản phẩm hoặc nội dung phù hợp.
C. Tự động hóa quy trình sản xuất.
D. Phát hiện gian lận tài chính.

12. Trong học máy, 'học có giám sát′ khác biệt chính so với 'học không giám sát′ là gì?

A. Học có giám sát sử dụng ít dữ liệu hơn học không giám sát.
B. Học có giám sát đòi hỏi dữ liệu đã được gán nhãn, trong khi học không giám sát thì không.
C. Học không giám sát luôn cho kết quả chính xác hơn học có giám sát.
D. Học có giám sát chỉ áp dụng cho bài toán phân loại, học không giám sát chỉ cho bài toán hồi quy.

13. Độ đo 'precision′ (độ chính xác) trong bài toán phân loại đo lường điều gì?

A. Tỷ lệ dự đoán đúng trên tổng số mẫu thực tế là tích cực.
B. Tỷ lệ dự đoán đúng là tích cực trên tổng số mẫu được dự đoán là tích cực.
C. Tỷ lệ dự đoán sai là tiêu cực trên tổng số mẫu thực tế là tiêu cực.
D. Tỷ lệ dự đoán sai là tích cực trên tổng số mẫu được dự đoán là tích cực.

14. Trong bài toán 'anomaly detection′ (phát hiện bất thường), mục tiêu chính là gì?

A. Phân loại dữ liệu thành các nhóm khác nhau.
B. Dự đoán giá trị liên tục.
C. Xác định các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu còn lại.
D. Giảm chiều dữ liệu.

15. Bước 'data preprocessing′ (tiền xử lý dữ liệu) thường bao gồm các công đoạn nào?

A. Huấn luyện mô hình và đánh giá hiệu suất.
B. Thu thập dữ liệu và triển khai mô hình.
C. Làm sạch dữ liệu, xử lý giá trị thiếu, và chuyển đổi dữ liệu.
D. Tối ưu hóa tham số mô hình.

16. Thuật toán K-means thường được sử dụng cho loại bài toán học máy nào?

A. Phân loại văn bản.
B. Hồi quy tuyến tính.
C. Phân cụm dữ liệu.
D. Giảm chiều dữ liệu.

17. Mục tiêu chính của 'feature engineering′ (kỹ thuật đặc trưng) trong học máy là gì?

A. Giảm số lượng dữ liệu huấn luyện.
B. Cải thiện hiệu suất mô hình bằng cách tạo ra các đặc trưng phù hợp và có ý nghĩa từ dữ liệu thô.
C. Tăng tốc độ huấn luyện mô hình.
D. Đơn giản hóa thuật toán học máy.

18. Sự khác biệt chính giữa Học máy và Học sâu (Deep Learning) là gì?

A. Học máy sử dụng ít dữ liệu hơn Học sâu.
B. Học sâu là một nhánh của Học máy, sử dụng mạng nơ-ron sâu với nhiều lớp.
C. Học máy chỉ áp dụng cho dữ liệu có cấu trúc, Học sâu cho dữ liệu phi cấu trúc.
D. Học sâu luôn cho kết quả tốt hơn Học máy trong mọi bài toán.

19. 'Explainable AI′ (XAI - AI có thể giải thích) tập trung vào khía cạnh nào của học máy?

A. Tăng độ chính xác của mô hình.
B. Làm cho quyết định của mô hình học máy trở nên dễ hiểu và minh bạch đối với con người.
C. Giảm kích thước mô hình.
D. Tăng tốc độ huấn luyện mô hình.

20. Phương pháp giảm chiều dữ liệu 'PCA′ (Principal Component Analysis) hoạt động dựa trên nguyên tắc nào?

A. Loại bỏ các đặc trưng ít quan trọng nhất.
B. Tìm các thành phần chính (principal components) là tổ hợp tuyến tính của các đặc trưng gốc, giữ lại phương sai lớn nhất.
C. Chọn ngẫu nhiên một số đặc trưng.
D. Tăng số chiều dữ liệu để cải thiện hiệu suất.

21. Tại sao cần 'hyperparameter tuning′ (điều chỉnh siêu tham số) trong học máy?

A. Để tăng tốc độ huấn luyện mô hình.
B. Để cải thiện hiệu suất mô hình bằng cách tìm ra các giá trị siêu tham số tối ưu.
C. Để giảm kích thước dữ liệu huấn luyện.
D. Để đơn giản hóa cấu trúc mô hình.

22. Đâu là một ví dụ về thuật toán học máy 'ensemble′?

A. K-Nearest Neighbors.
B. Support Vector Machine.
C. Random Forest.
D. Linear Regression.

23. Trong học máy, 'regularization′ (chính quy hóa) thường được sử dụng để giải quyết vấn đề gì?

A. Underfitting (khớp thiếu).
B. Overfitting (quá khớp).
C. Dữ liệu bị thiếu.
D. Tính toán chậm.

24. Khi nào nên sử dụng thuật toán 'Naive Bayes′?

A. Khi dữ liệu có chiều cao và nhiều đặc trưng tương quan.
B. Khi cần một mô hình đơn giản, nhanh chóng và hiệu quả cho bài toán phân loại, đặc biệt với dữ liệu văn bản.
C. Khi cần độ chính xác tuyệt đối và chấp nhận thời gian huấn luyện lâu.
D. Khi dữ liệu không có nhãn.

25. Trong cây quyết định (Decision Tree), 'entropy′ và 'information gain′ được sử dụng để làm gì?

A. Đo lường độ phức tạp của cây.
B. Chọn đặc trưng tốt nhất để phân chia nút và xây dựng cây.
C. Cắt tỉa cây để tránh overfitting.
D. Đánh giá độ chính xác của cây.

26. Khái niệm 'curse of dimensionality′ (lời nguyền chiều dữ liệu) đề cập đến vấn đề gì?

A. Dữ liệu có quá nhiều lỗi.
B. Hiệu suất mô hình giảm khi số chiều dữ liệu (số lượng đặc trưng) tăng lên quá cao.
C. Mô hình quá phức tạp và khó giải thích.
D. Dữ liệu không đủ để huấn luyện mô hình.

27. Phương pháp 'boosting′ trong học máy hoạt động như thế nào?

A. Huấn luyện song song nhiều mô hình độc lập và lấy trung bình kết quả.
B. Huấn luyện tuần tự các mô hình yếu, mỗi mô hình tập trung vào việc sửa lỗi của mô hình trước đó, và kết hợp chúng thành một mô hình mạnh.
C. Chia dữ liệu thành nhiều phần và huấn luyện mô hình trên mỗi phần.
D. Chọn ngẫu nhiên một tập con các đặc trưng để huấn luyện mô hình.

28. Trong ngữ cảnh học máy, 'overfitting′ (quá khớp) xảy ra khi nào?

A. Mô hình quá đơn giản và không nắm bắt được cấu trúc dữ liệu.
B. Mô hình học quá tốt trên dữ liệu huấn luyện, nhưng kém hiệu quả trên dữ liệu mới.
C. Mô hình không hội tụ trong quá trình huấn luyện.
D. Dữ liệu huấn luyện chứa quá nhiều nhiễu.

29. Trong học sâu (Deep Learning), 'mạng nơ-ron tích chập′ (Convolutional Neural Network - CNN) đặc biệt hiệu quả cho loại dữ liệu nào?

A. Dữ liệu dạng bảng.
B. Dữ liệu chuỗi thời gian.
C. Dữ liệu hình ảnh và video.
D. Dữ liệu văn bản.

30. Đâu là một ứng dụng phổ biến của thuật toán 'clustering′ (phân cụm) trong thực tế?

A. Dự đoán giá cổ phiếu.
B. Phân loại email spam.
C. Phân khúc khách hàng trong marketing.
D. Nhận dạng khuôn mặt.

1 / 30

Category: Học máy

Tags: Bộ đề 6

1. Phân biệt `online learning′ (học trực tuyến) và `batch learning′ (học theo lô).

2 / 30

Category: Học máy

Tags: Bộ đề 6

2. Trong mạng nơ-ron (Neural Network), `activation function′ (hàm kích hoạt) có vai trò gì?

3 / 30

Category: Học máy

Tags: Bộ đề 6

3. Phương pháp `cross-validation′ (kiểm định chéo) được sử dụng để làm gì trong học máy?

4 / 30

Category: Học máy

Tags: Bộ đề 6

4. Metric `F1-score′ là trung bình điều hòa của hai độ đo nào?

5 / 30

Category: Học máy

Tags: Bộ đề 6

5. Thuật toán `Gradient Descent′ được sử dụng để làm gì trong huấn luyện mô hình học máy?

6 / 30

Category: Học máy

Tags: Bộ đề 6

6. SVM (Support Vector Machine) hoạt động tốt nhất trong trường hợp nào?

7 / 30

Category: Học máy

Tags: Bộ đề 6

7. Ưu điểm chính của phương pháp học máy `transfer learning′ (học chuyển giao) là gì?

8 / 30

Category: Học máy

Tags: Bộ đề 6

8. Học máy, về bản chất, là gì?

9 / 30

Category: Học máy

Tags: Bộ đề 6

9. Một trong những thách thức đạo đức lớn nhất trong học máy là gì?

10 / 30

Category: Học máy

Tags: Bộ đề 6

10. NLP (Xử lý ngôn ngữ tự nhiên) là lĩnh vực học máy tập trung vào điều gì?

11 / 30

Category: Học máy

Tags: Bộ đề 6

11. Hệ thống khuyến nghị (Recommender System) sử dụng học máy để làm gì?

12 / 30

Category: Học máy

Tags: Bộ đề 6

12. Trong học máy, `học có giám sát′ khác biệt chính so với `học không giám sát′ là gì?

13 / 30

Category: Học máy

Tags: Bộ đề 6

13. Độ đo `precision′ (độ chính xác) trong bài toán phân loại đo lường điều gì?

14 / 30

Category: Học máy

Tags: Bộ đề 6

14. Trong bài toán `anomaly detection′ (phát hiện bất thường), mục tiêu chính là gì?

15 / 30

Category: Học máy

Tags: Bộ đề 6

15. Bước `data preprocessing′ (tiền xử lý dữ liệu) thường bao gồm các công đoạn nào?

16 / 30

Category: Học máy

Tags: Bộ đề 6

16. Thuật toán K-means thường được sử dụng cho loại bài toán học máy nào?

17 / 30

Category: Học máy

Tags: Bộ đề 6

17. Mục tiêu chính của `feature engineering′ (kỹ thuật đặc trưng) trong học máy là gì?

18 / 30

Category: Học máy

Tags: Bộ đề 6

18. Sự khác biệt chính giữa Học máy và Học sâu (Deep Learning) là gì?

19 / 30

Category: Học máy

Tags: Bộ đề 6

19. `Explainable AI′ (XAI - AI có thể giải thích) tập trung vào khía cạnh nào của học máy?

20 / 30

Category: Học máy

Tags: Bộ đề 6

20. Phương pháp giảm chiều dữ liệu `PCA′ (Principal Component Analysis) hoạt động dựa trên nguyên tắc nào?

21 / 30

Category: Học máy

Tags: Bộ đề 6

21. Tại sao cần `hyperparameter tuning′ (điều chỉnh siêu tham số) trong học máy?

22 / 30

Category: Học máy

Tags: Bộ đề 6

22. Đâu là một ví dụ về thuật toán học máy `ensemble′?

23 / 30

Category: Học máy

Tags: Bộ đề 6

23. Trong học máy, `regularization′ (chính quy hóa) thường được sử dụng để giải quyết vấn đề gì?

24 / 30

Category: Học máy

Tags: Bộ đề 6

24. Khi nào nên sử dụng thuật toán `Naive Bayes′?

25 / 30

Category: Học máy

Tags: Bộ đề 6

25. Trong cây quyết định (Decision Tree), `entropy′ và `information gain′ được sử dụng để làm gì?

26 / 30

Category: Học máy

Tags: Bộ đề 6

26. Khái niệm `curse of dimensionality′ (lời nguyền chiều dữ liệu) đề cập đến vấn đề gì?

27 / 30

Category: Học máy

Tags: Bộ đề 6

27. Phương pháp `boosting′ trong học máy hoạt động như thế nào?

28 / 30

Category: Học máy

Tags: Bộ đề 6

28. Trong ngữ cảnh học máy, `overfitting′ (quá khớp) xảy ra khi nào?

29 / 30

Category: Học máy

Tags: Bộ đề 6

29. Trong học sâu (Deep Learning), `mạng nơ-ron tích chập′ (Convolutional Neural Network - CNN) đặc biệt hiệu quả cho loại dữ liệu nào?

30 / 30

Category: Học máy

Tags: Bộ đề 6

30. Đâu là một ứng dụng phổ biến của thuật toán `clustering′ (phân cụm) trong thực tế?