1. Khi phân tích hình ảnh y tế để phát hiện khối u, các thuật toán học máy thường sử dụng loại dữ liệu nào làm đầu vào?
A. Dữ liệu văn bản
B. Dữ liệu dạng chuỗi thời gian
C. Dữ liệu hình ảnh (Image data)
D. Dữ liệu âm thanh
2. Một ứng dụng thực tế của học máy trong lĩnh vực y tế là chẩn đoán bệnh dựa trên triệu chứng. Đây là một ví dụ về bài toán gì trong học có giám sát?
A. Hồi quy
B. Phân loại
C. Phân cụm
D. Học tăng cường
3. Khi bạn muốn dự đoán một giá trị số cụ thể, ví dụ như giá nhà dựa trên các đặc điểm của nó, bạn đang thực hiện loại hình học máy nào?
A. Phân loại
B. Phân cụm
C. Hồi quy
D. Học tăng cường
4. Trong học có giám sát, tập dữ liệu được sử dụng để đánh giá hiệu suất của mô hình sau khi huấn luyện được gọi là gì?
A. Tập huấn luyện (Training set)
B. Tập kiểm tra (Test set)
C. Tập xác thực (Validation set)
D. Tập dữ liệu thô (Raw data set)
5. Khái niệm model interpretability (khả năng diễn giải mô hình) quan trọng trong học máy vì lý do gì?
A. Giúp mô hình hoạt động nhanh hơn.
B. Giúp hiểu cách mô hình đưa ra dự đoán, đặc biệt quan trọng trong các lĩnh vực nhạy cảm như y tế, tài chính.
C. Giảm thiểu kích thước của tập dữ liệu huấn luyện.
D. Tự động hóa quá trình tìm kiếm đặc trưng.
6. Thuật toán K-Means thường được sử dụng cho nhiệm vụ nào trong học máy?
A. Hồi quy tuyến tính
B. Phân loại
C. Phân cụm (Clustering)
D. Giảm chiều dữ liệu
7. Trong học tăng cường, thuật ngữ state (trạng thái) đề cập đến điều gì?
A. Hành động mà tác tử thực hiện.
B. Phần thưởng mà tác tử nhận được.
C. Tình huống hiện tại của môi trường mà tác tử đang tương tác.
D. Mục tiêu cuối cùng mà tác tử muốn đạt được.
8. Học máy có thể được ứng dụng để phát hiện gian lận trong các giao dịch ngân hàng. Đây là một ví dụ về ứng dụng của loại hình học máy nào?
A. Học không giám sát (ví dụ: phát hiện điểm bất thường)
B. Học có giám sát (ví dụ: phân loại giao dịch là gian lận hay không)
C. Học tăng cường
D. Cả hai loại hình học có giám sát và không giám sát
9. Khi một mô hình học máy hoạt động tốt trên dữ liệu huấn luyện nhưng lại kém hiệu quả trên dữ liệu mới chưa từng thấy, hiện tượng này được gọi là gì?
A. Trơn tru hóa (Smoothing)
B. Quá khớp (Overfitting)
C. Thiếu khớp (Underfitting)
D. Tối ưu hóa (Optimization)
10. Khái niệm feature engineering trong học máy đề cập đến quá trình nào?
A. Huấn luyện mô hình với dữ liệu thô.
B. Lựa chọn thuật toán tốt nhất cho bài toán.
C. Tạo ra các đặc trưng (features) mới từ dữ liệu gốc để cải thiện hiệu suất mô hình.
D. Đánh giá mô hình bằng các chỉ số như độ chính xác.
11. Một kỹ thuật học máy được thiết kế để xử lý dữ liệu có cấu trúc dạng lưới hoặc grid, thường áp dụng cho hình ảnh, là gì?
A. Mạng nơ-ron hồi quy (Recurrent Neural Networks - RNNs)
B. Mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs)
C. Máy học vector hỗ trợ (Support Vector Machines - SVMs)
D. Cây quyết định (Decision Trees)
12. Thành phần nào sau đây KHÔNG phải là một loại dữ liệu được sử dụng phổ biến trong học máy?
A. Dữ liệu dạng bảng (Tabular data)
B. Dữ liệu văn bản (Text data)
C. Dữ liệu âm thanh (Audio data)
D. Dữ liệu vật lý (Physical data)
13. Nhiệm vụ phân loại là một ví dụ điển hình của loại hình học máy nào, trong đó mô hình được yêu cầu gán một nhãn hoặc danh mục cho dữ liệu đầu vào?
A. Học không giám sát
B. Học tăng cường
C. Học có giám sát
D. Phân cụm (Clustering)
14. Một mô hình học máy được coi là underfitting (thiếu khớp) khi nào?
A. Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
B. Mô hình không nắm bắt được cấu trúc cơ bản của dữ liệu và có lỗi cao trên cả dữ liệu huấn luyện và kiểm tra.
C. Mô hình rất nhạy cảm với những thay đổi nhỏ trong dữ liệu huấn luyện.
D. Mô hình đã đạt đến độ chính xác tối đa.
15. Khái niệm data preprocessing (tiền xử lý dữ liệu) trong học máy bao gồm các bước nào?
A. Huấn luyện mô hình và tinh chỉnh siêu tham số.
B. Làm sạch dữ liệu, xử lý giá trị thiếu, chuẩn hóa và biến đổi dữ liệu.
C. Đánh giá hiệu suất mô hình bằng các chỉ số.
D. Trực quan hóa kết quả dự đoán.
16. Trong học máy, hyperparameter tuning (tinh chỉnh siêu tham số) là quá trình gì?
A. Huấn luyện mô hình với dữ liệu đã được làm sạch.
B. Chọn thuật toán học máy phù hợp nhất cho bài toán.
C. Tìm kiếm các giá trị tốt nhất cho các tham số của thuật toán không được học từ dữ liệu.
D. Đánh giá độ chính xác của mô hình trên tập kiểm tra.
17. Khi một mô hình học máy có variance cao, điều đó có nghĩa là gì?
A. Mô hình quá đơn giản và không học được các mẫu phức tạp.
B. Mô hình rất nhạy cảm với những thay đổi nhỏ trong dữ liệu huấn luyện.
C. Mô hình có sai số hệ thống cao.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
18. Một trong những thách thức chính trong học máy là bias-variance tradeoff. Hiện tượng bias cao thường liên quan đến điều gì?
A. Mô hình quá phức tạp, học quá sát dữ liệu huấn luyện.
B. Mô hình quá đơn giản, không nắm bắt được mối quan hệ thực sự trong dữ liệu.
C. Sự biến động lớn của mô hình khi thay đổi tập dữ liệu huấn luyện.
D. Dữ liệu huấn luyện có quá nhiều nhiễu.
19. Một thuật toán học máy được huấn luyện trên một tập dữ liệu bao gồm các cặp đầu vào và đầu ra mong muốn. Mục tiêu của thuật toán là học cách ánh xạ từ đầu vào đến đầu ra. Đây là ví dụ về loại hình học máy nào?
A. Học không giám sát
B. Học tăng cường
C. Học có giám sát
D. Học sâu
20. Trong học có giám sát, bài toán Hồi quy (Regression) khác với bài toán Phân loại (Classification) ở điểm nào?
A. Hồi quy dự đoán giá trị liên tục, Phân loại dự đoán nhãn rời rạc.
B. Hồi quy sử dụng dữ liệu không nhãn, Phân loại sử dụng dữ liệu có nhãn.
C. Hồi quy là học không giám sát, Phân loại là học có giám sát.
D. Hồi quy tìm mẫu ẩn, Phân loại gán nhãn.
21. Theo phân loại phổ biến của các loại hình học máy, loại hình nào tập trung vào việc tìm ra các quy tắc hoặc mẫu ẩn trong dữ liệu mà không có nhãn đi kèm?
A. Học có giám sát
B. Học không giám sát
C. Học tăng cường
D. Học bán giám sát
22. Trong học không giám sát, nhiệm vụ tìm kiếm các nhóm dữ liệu tương tự nhau được gọi là:
A. Phân loại (Classification)
B. Phân cụm (Clustering)
C. Hồi quy (Regression)
D. Giảm chiều dữ liệu (Dimensionality Reduction)
23. Trong ngữ cảnh học máy, model evaluation (đánh giá mô hình) nhằm mục đích gì?
A. Tìm kiếm các mẫu ẩn trong dữ liệu.
B. Chọn ra các đặc trưng tốt nhất cho mô hình.
C. Đo lường khả năng tổng quát hóa và hiệu suất của mô hình trên dữ liệu mới.
D. Điều chỉnh siêu tham số (hyperparameters) của thuật toán.
24. Một tác tử (agent) học cách đưa ra các quyết định trong một môi trường để tối đa hóa phần thưởng tích lũy. Tác tử học bằng cách thử và sai, nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Loại hình học máy này được gọi là gì?
A. Học có giám sát
B. Học không giám sát
C. Học tăng cường
D. Học chuyển giao
25. Mục tiêu chính của việc sử dụng tập xác thực (validation set) trong quá trình phát triển mô hình học máy là gì?
A. Đánh giá hiệu suất cuối cùng của mô hình.
B. Điều chỉnh siêu tham số (hyperparameters) của mô hình để tránh quá khớp.
C. Huấn luyện mô hình ban đầu.
D. Kiểm tra xem mô hình có hoạt động tốt trên dữ liệu hoàn toàn mới không.