Đề 9 – Bài tập, đề thi trắc nghiệm online Học máy

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Học máy

Đề 9 - Bài tập, đề thi trắc nghiệm online Học máy

1. Trong bài toán phân loại (classification), độ đo 'độ chính xác′ (accuracy) được tính bằng:

A. Tỷ lệ mẫu dự đoán sai trên tổng số mẫu.
B. Tỷ lệ mẫu dự đoán đúng trên tổng số mẫu.
C. Tỷ lệ mẫu dự đoán đúng là dương tính trên tổng số mẫu thực tế là dương tính.
D. Tỷ lệ mẫu dự đoán đúng là âm tính trên tổng số mẫu thực tế là âm tính.

2. Khi nào nên sử dụng 'học sâu′ (Deep Learning) thay vì các phương pháp học máy truyền thống?

A. Khi dữ liệu huấn luyện ít.
B. Khi cần mô hình đơn giản và dễ giải thích.
C. Khi dữ liệu phức tạp, phi cấu trúc (như ảnh, văn bản, âm thanh) và có lượng lớn.
D. Khi yêu cầu tốc độ huấn luyện nhanh.

3. Trong xử lý ngôn ngữ tự nhiên (NLP), 'word embedding′ (nhúng từ) được sử dụng để làm gì?

A. Mã hóa văn bản thành hình ảnh.
B. Biểu diễn từ ngữ thành các vectơ số trong không gian vectơ, phản ánh ngữ nghĩa và quan hệ giữa các từ.
C. Phân loại văn bản theo chủ đề.
D. Tách từ trong câu văn.

4. Trong học tăng cường (Reinforcement Learning), 'môi trường′ (environment) là gì?

A. Dữ liệu huấn luyện được sử dụng.
B. Mô hình học máy đang được huấn luyện.
C. Không gian mà tác nhân (agent) tương tác và hành động.
D. Thuật toán học tăng cường cụ thể.

5. Hàm kích hoạt (activation function) trong mạng nơ-ron nhân tạo có vai trò gì?

A. Tăng tốc độ huấn luyện mạng.
B. Giảm số lượng tham số của mạng.
C. Đưa tính phi tuyến vào mạng, cho phép mô hình học các mối quan hệ phức tạp.
D. Chuẩn hóa dữ liệu đầu vào.

6. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong lĩnh vực nào?

A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
B. Phân tích dữ liệu chuỗi thời gian (Time Series Data).
C. Xử lý ảnh và thị giác máy tính (Computer Vision).
D. Hệ thống khuyến nghị (Recommender Systems).

7. Trong học máy, 'học có giám sát′ (Supervised Learning) khác biệt chính so với 'học không giám sát′ (Unsupervised Learning) ở điểm nào?

A. Học có giám sát sử dụng ít dữ liệu hơn học không giám sát.
B. Học có giám sát cần dữ liệu đã được gán nhãn (labeled data), trong khi học không giám sát làm việc với dữ liệu chưa gán nhãn.
C. Học có giám sát luôn cho kết quả chính xác hơn học không giám sát.
D. Học có giám sát chỉ áp dụng cho dữ liệu dạng số, còn học không giám sát cho dữ liệu phi cấu trúc.

8. Trong 'kiểm định chéo′ (cross-validation), kỹ thuật 'k-fold cross-validation′ chia tập dữ liệu thành bao nhiêu phần?

A. 2 phần (tập huấn luyện và tập kiểm thử).
B. 3 phần (tập huấn luyện, tập kiểm định, tập kiểm thử).
C. k phần, trong đó k-1 phần dùng để huấn luyện và 1 phần dùng để kiểm định, quá trình lặp lại k lần với mỗi phần được dùng làm tập kiểm định một lần.
D. k phần, tất cả đều được dùng để huấn luyện mô hình.

9. Thuật toán 'Cây quyết định′ (Decision Tree) hoạt động dựa trên nguyên tắc nào?

A. Tìm kiếm siêu phẳng phân tách dữ liệu tốt nhất.
B. Phân chia dữ liệu thành các nhánh dựa trên các thuộc tính, tạo thành cấu trúc cây.
C. Tính toán khoảng cách giữa các điểm dữ liệu và gán chúng vào cụm gần nhất.
D. Mô phỏng cách hoạt động của mạng nơ-ron sinh học.

10. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán học có giám sát?

A. Cây quyết định (Decision Tree).
B. Máy vectơ hỗ trợ (Support Vector Machine).
C. K-means clustering.
D. Hồi quy tuyến tính (Linear Regression).

11. Trong thuật toán K-means clustering, giá trị 'K′ đại diện cho:

A. Số chiều của dữ liệu.
B. Số lượng cụm (clusters) mong muốn.
C. Số lần lặp tối đa của thuật toán.
D. Khoảng cách tối thiểu giữa các điểm dữ liệu.

12. Hiện tượng 'quá khớp′ (overfitting) trong học máy xảy ra khi nào?

A. Mô hình hoạt động quá chậm.
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm thử.
C. Mô hình không đủ dữ liệu để học.
D. Mô hình quá đơn giản để nắm bắt được cấu trúc dữ liệu.

13. Phương pháp 'chính quy hóa L1′ (L1 regularization) khác biệt so với 'chính quy hóa L2′ (L2 regularization) chủ yếu ở điểm nào?

A. L1 regularization mạnh hơn L2 regularization.
B. L1 regularization có xu hướng tạo ra các trọng số稀疏 (sparse weights), tức là nhiều trọng số bằng 0, trong khi L2 regularization thu nhỏ tất cả các trọng số.
C. L1 regularization dễ tính toán hơn L2 regularization.
D. L1 regularization chỉ áp dụng cho mô hình tuyến tính, còn L2 regularization cho mạng nơ-ron.

14. Trong học máy, 'dữ liệu nhiễu′ (noisy data) có thể gây ra vấn đề gì?

A. Tăng tốc độ huấn luyện.
B. Cải thiện độ chính xác của mô hình.
C. Giảm khả năng tổng quát hóa của mô hình, dẫn đến overfitting.
D. Đơn giản hóa mô hình.

15. Mục tiêu chính của việc 'chia tập dữ liệu′ thành 'tập huấn luyện′ (training set) và 'tập kiểm thử' (test set) trong học máy là gì?

A. Để tăng tốc độ huấn luyện mô hình.
B. Để giảm dung lượng dữ liệu cần thiết.
C. Để đánh giá khả năng tổng quát hóa (generalization) của mô hình trên dữ liệu mới, chưa từng thấy.
D. Để đơn giản hóa quá trình tiền xử lý dữ liệu.

16. Học máy (Machine Learning) được định nghĩa chính xác nhất là:

A. Một lĩnh vực của khoa học máy tính cho phép máy tính tự lập trình.
B. Một phương pháp lập trình phức tạp để tạo ra các chương trình thông minh.
C. Một lĩnh vực của trí tuệ nhân tạo cho phép hệ thống máy tính học từ dữ liệu mà không cần được lập trình явно.
D. Một tập hợp các thuật toán thống kê để phân tích dữ liệu lớn.

17. Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng 'quá khớp′ (overfitting)?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Sử dụng mô hình phức tạp hơn.
C. Giảm số lượng đặc trưng (features) đầu vào hoặc sử dụng kỹ thuật регуляризация (regularization).
D. Tăng số lượng vòng lặp huấn luyện (epochs).

18. Ưu điểm chính của thuật toán 'Máy vectơ hỗ trợ' (Support Vector Machine - SVM) so với các thuật toán phân loại khác là gì?

A. Khả năng xử lý dữ liệu kích thước lớn nhanh chóng.
B. Hiệu quả cao trong không gian đặc trưng chiều cao, khả năng tổng quát hóa tốt.
C. Dễ dàng giải thích kết quả và trực quan hóa mô hình.
D. Yêu cầu ít điều chỉnh гиперпараметр (hyperparameter) hơn.

19. Khái niệm 'hàm phần thưởng′ (reward function) trong học tăng cường có vai trò gì?

A. Đo lường độ phức tạp của môi trường.
B. Hướng dẫn tác nhân (agent) học hành vi mong muốn bằng cách định nghĩa mục tiêu và đánh giá hành động.
C. Xác định kiến trúc mạng nơ-ron phù hợp.
D. Phân tích hiệu suất của tác nhân.

20. Khái niệm 'gradient descent′ (hạ gradient) là gì trong tối ưu hóa mô hình học máy?

A. Một phương pháp đánh giá hiệu suất mô hình.
B. Một thuật toán tìm giá trị nhỏ nhất của hàm mất mát bằng cách di chuyển theo hướng ngược với gradient.
C. Một kỹ thuật chuẩn hóa dữ liệu.
D. Một phương pháp giảm chiều dữ liệu.

21. Phương pháp 'giảm chiều dữ liệu′ (dimensionality reduction) như PCA (Principal Component Analysis) được sử dụng khi nào?

A. Khi muốn tăng số lượng đặc trưng.
B. Khi dữ liệu có quá nhiều chiều, gây khó khăn trong tính toán và trực quan hóa, hoặc khi có hiện tượng 'nguyền rủa chiều cao′ (curse of dimensionality).
C. Khi dữ liệu bị thiếu giá trị.
D. Khi muốn tăng tốc độ thu thập dữ liệu.

22. Mô hình 'ensemble′ (mô hình kết hợp) như Random Forest hoặc Gradient Boosting hoạt động dựa trên nguyên tắc nào?

A. Sử dụng một thuật toán học máy duy nhất nhưng mạnh mẽ.
B. Kết hợp dự đoán của nhiều mô hình học máy yếu (weak learners) để tạo ra một mô hình mạnh hơn.
C. Chia nhỏ dữ liệu huấn luyện thành nhiều phần nhỏ và huấn luyện mô hình trên từng phần.
D. Lựa chọn mô hình tốt nhất từ một tập hợp các mô hình khác nhau.

23. Vấn đề 'bias-variance tradeoff′ (đánh đổi giữa độ chệch và phương sai) trong học máy đề cập đến điều gì?

A. Sự đánh đổi giữa độ chính xác và tốc độ của mô hình.
B. Sự đánh đổi giữa khả năng giải thích mô hình và hiệu suất dự đoán.
C. Sự đánh đổi giữa độ chệch (bias - lỗi do mô hình quá đơn giản) và phương sai (variance - lỗi do mô hình quá phức tạp và nhạy cảm với dữ liệu huấn luyện).
D. Sự đánh đổi giữa kích thước dữ liệu huấn luyện và kích thước mô hình.

24. Độ đo 'F1-score′ thường được ưu tiên sử dụng hơn 'độ chính xác′ (accuracy) trong trường hợp nào?

A. Khi tập dữ liệu cân bằng (số lượng mẫu ở các lớp gần bằng nhau).
B. Khi tập dữ liệu không cân bằng (số lượng mẫu ở các lớp chênh lệch lớn).
C. Khi cần đánh giá tốc độ của mô hình.
D. Khi muốn tối ưu hóa thời gian huấn luyện.

25. Trong ngữ cảnh 'hệ thống khuyến nghị' (recommender systems), 'lọc cộng tác′ (collaborative filtering) hoạt động dựa trên nguyên tắc nào?

A. Phân tích nội dung của các mục (items) để đưa ra khuyến nghị.
B. Dựa trên lịch sử tương tác và sở thích của người dùng tương tự để đưa ra khuyến nghị.
C. Kết hợp nội dung của mục và thông tin người dùng.
D. Sử dụng thông tin nhân khẩu học của người dùng để đưa ra khuyến nghị.

26. Quá trình 'lan truyền ngược′ (backpropagation) trong huấn luyện mạng nơ-ron được sử dụng để làm gì?

A. Dự đoán đầu ra của mạng.
B. Tính toán độ chính xác của mô hình.
C. Cập nhật trọng số (weights) của mạng để giảm thiểu hàm mất mát (loss function).
D. Lựa chọn kiến trúc mạng phù hợp.

27. Trong 'học chuyển giao′ (transfer learning), lợi ích chính là gì?

A. Giảm độ phức tạp của mô hình.
B. Tăng tốc độ suy luận (inference).
C. Tận dụng kiến thức đã học từ một tác vụ (hoặc tập dữ liệu) để cải thiện hiệu suất trên một tác vụ khác, đặc biệt khi dữ liệu cho tác vụ mới hạn chế.
D. Cải thiện khả năng giải thích mô hình.

28. Kỹ thuật 'feature scaling′ (tỉ lệ hóa đặc trưng) thường được áp dụng trong tiền xử lý dữ liệu học máy với mục đích chính là gì?

A. Giảm kích thước dữ liệu.
B. Tăng độ chính xác của mô hình.
C. Đảm bảo các đặc trưng có cùng phạm vi giá trị, giúp các thuật toán hội tụ nhanh hơn và ổn định hơn.
D. Loại bỏ dữ liệu nhiễu.

29. Phương pháp 'boosting′ (ví dụ: AdaBoost, Gradient Boosting) khác biệt với 'bagging′ (ví dụ: Random Forest) như thế nào?

A. Boosting huấn luyện các mô hình song song, còn bagging tuần tự.
B. Boosting tập trung vào việc giảm phương sai, còn bagging giảm độ chệch.
C. Boosting huấn luyện các mô hình tuần tự, trong đó mỗi mô hình tiếp theo cố gắng sửa lỗi của các mô hình trước, còn bagging huấn luyện các mô hình độc lập song song.
D. Boosting chỉ áp dụng cho cây quyết định, còn bagging cho mọi thuật toán.

30. Đơn vị tính toán cơ bản trong mạng nơ-ron nhân tạo được gọi là gì?

A. Kernel.
B. Neuron (nơ-ron) hay Perceptron.
C. Layer (lớp).
D. Weight (trọng số).

1 / 30

Category: Học máy

Tags: Bộ đề 9

1. Trong bài toán phân loại (classification), độ đo `độ chính xác′ (accuracy) được tính bằng:

2 / 30

Category: Học máy

Tags: Bộ đề 9

2. Khi nào nên sử dụng `học sâu′ (Deep Learning) thay vì các phương pháp học máy truyền thống?

3 / 30

Category: Học máy

Tags: Bộ đề 9

3. Trong xử lý ngôn ngữ tự nhiên (NLP), `word embedding′ (nhúng từ) được sử dụng để làm gì?

4 / 30

Category: Học máy

Tags: Bộ đề 9

4. Trong học tăng cường (Reinforcement Learning), `môi trường′ (environment) là gì?

5 / 30

Category: Học máy

Tags: Bộ đề 9

5. Hàm kích hoạt (activation function) trong mạng nơ-ron nhân tạo có vai trò gì?

6 / 30

Category: Học máy

Tags: Bộ đề 9

6. Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong lĩnh vực nào?

7 / 30

Category: Học máy

Tags: Bộ đề 9

7. Trong học máy, `học có giám sát′ (Supervised Learning) khác biệt chính so với `học không giám sát′ (Unsupervised Learning) ở điểm nào?

8 / 30

Category: Học máy

Tags: Bộ đề 9

8. Trong `kiểm định chéo′ (cross-validation), kỹ thuật `k-fold cross-validation′ chia tập dữ liệu thành bao nhiêu phần?

9 / 30

Category: Học máy

Tags: Bộ đề 9

9. Thuật toán `Cây quyết định′ (Decision Tree) hoạt động dựa trên nguyên tắc nào?

10 / 30

Category: Học máy

Tags: Bộ đề 9

10. Thuật toán nào sau đây KHÔNG thuộc nhóm thuật toán học có giám sát?

11 / 30

Category: Học máy

Tags: Bộ đề 9

11. Trong thuật toán K-means clustering, giá trị `K′ đại diện cho:

12 / 30

Category: Học máy

Tags: Bộ đề 9

12. Hiện tượng `quá khớp′ (overfitting) trong học máy xảy ra khi nào?

13 / 30

Category: Học máy

Tags: Bộ đề 9

13. Phương pháp `chính quy hóa L1′ (L1 regularization) khác biệt so với `chính quy hóa L2′ (L2 regularization) chủ yếu ở điểm nào?

14 / 30

Category: Học máy

Tags: Bộ đề 9

14. Trong học máy, `dữ liệu nhiễu′ (noisy data) có thể gây ra vấn đề gì?

15 / 30

Category: Học máy

Tags: Bộ đề 9

15. Mục tiêu chính của việc `chia tập dữ liệu′ thành `tập huấn luyện′ (training set) và `tập kiểm thử` (test set) trong học máy là gì?

16 / 30

Category: Học máy

Tags: Bộ đề 9

16. Học máy (Machine Learning) được định nghĩa chính xác nhất là:

17 / 30

Category: Học máy

Tags: Bộ đề 9

17. Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng `quá khớp′ (overfitting)?

18 / 30

Category: Học máy

Tags: Bộ đề 9

18. Ưu điểm chính của thuật toán `Máy vectơ hỗ trợ` (Support Vector Machine - SVM) so với các thuật toán phân loại khác là gì?

19 / 30

Category: Học máy

Tags: Bộ đề 9

19. Khái niệm `hàm phần thưởng′ (reward function) trong học tăng cường có vai trò gì?

20 / 30

Category: Học máy

Tags: Bộ đề 9

20. Khái niệm `gradient descent′ (hạ gradient) là gì trong tối ưu hóa mô hình học máy?

21 / 30

Category: Học máy

Tags: Bộ đề 9

21. Phương pháp `giảm chiều dữ liệu′ (dimensionality reduction) như PCA (Principal Component Analysis) được sử dụng khi nào?

22 / 30

Category: Học máy

Tags: Bộ đề 9

22. Mô hình `ensemble′ (mô hình kết hợp) như Random Forest hoặc Gradient Boosting hoạt động dựa trên nguyên tắc nào?

23 / 30

Category: Học máy

Tags: Bộ đề 9

23. Vấn đề `bias-variance tradeoff′ (đánh đổi giữa độ chệch và phương sai) trong học máy đề cập đến điều gì?

24 / 30

Category: Học máy

Tags: Bộ đề 9

24. Độ đo `F1-score′ thường được ưu tiên sử dụng hơn `độ chính xác′ (accuracy) trong trường hợp nào?

25 / 30

Category: Học máy

Tags: Bộ đề 9

25. Trong ngữ cảnh `hệ thống khuyến nghị` (recommender systems), `lọc cộng tác′ (collaborative filtering) hoạt động dựa trên nguyên tắc nào?

26 / 30

Category: Học máy

Tags: Bộ đề 9

26. Quá trình `lan truyền ngược′ (backpropagation) trong huấn luyện mạng nơ-ron được sử dụng để làm gì?

27 / 30

Category: Học máy

Tags: Bộ đề 9

27. Trong `học chuyển giao′ (transfer learning), lợi ích chính là gì?

28 / 30

Category: Học máy

Tags: Bộ đề 9

28. Kỹ thuật `feature scaling′ (tỉ lệ hóa đặc trưng) thường được áp dụng trong tiền xử lý dữ liệu học máy với mục đích chính là gì?

29 / 30

Category: Học máy

Tags: Bộ đề 9

29. Phương pháp `boosting′ (ví dụ: AdaBoost, Gradient Boosting) khác biệt với `bagging′ (ví dụ: Random Forest) như thế nào?

30 / 30

Category: Học máy

Tags: Bộ đề 9

30. Đơn vị tính toán cơ bản trong mạng nơ-ron nhân tạo được gọi là gì?