Đề 5 – Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Xử lý ngôn ngữ tự nhiên

Đề 5 - Bài tập, đề thi trắc nghiệm online Xử lý ngôn ngữ tự nhiên

1. Phương pháp 'rule-based NLP′ (NLP dựa trên quy tắc) hoạt động dựa trên điều gì?

A. Học từ dữ liệu lớn.
B. Các quy tắc ngôn ngữ được lập trình thủ công.
C. Mạng nơ-ron sâu.
D. Thống kê tần suất từ.

2. Mô hình ngôn ngữ (language model) trong NLP có chức năng chính là gì?

A. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
B. Dự đoán xác suất xuất hiện của một chuỗi từ hoặc từ tiếp theo trong chuỗi.
C. Phân loại văn bản theo chủ đề.
D. Phân tích cảm xúc của văn bản.

3. Thách thức đạo đức nào sau đây là một vấn đề quan trọng trong phát triển và ứng dụng NLP?

A. Tốc độ xử lý chậm.
B. Thiên kiến (bias) trong dữ liệu huấn luyện dẫn đến kết quả không công bằng.
C. Khả năng hiểu ngôn ngữ hình tượng kém.
D. Chi phí tính toán cao.

4. Kỹ thuật 'POS tagging′ (gán nhãn từ loại) trong NLP nhằm mục đích gì?

A. Phân tích cảm xúc của từ.
B. Gán nhãn ngữ pháp (ví dụ: danh từ, động từ, tính từ) cho mỗi từ trong câu.
C. Tìm kiếm từ đồng nghĩa và trái nghĩa.
D. Tóm tắt nội dung chính của câu.

5. Metric (độ đo) nào thường được sử dụng để đánh giá hiệu suất của mô hình dịch máy?

A. Accuracy (độ chính xác).
B. BLEU (Bilingual Evaluation Understudy).
C. F1-score.
D. Precision (độ chuẩn xác).

6. Trong ngữ cảnh của chatbot, 'intent recognition′ (nhận dạng ý định) là gì?

A. Xác định cảm xúc của người dùng.
B. Hiểu mục đích hoặc yêu cầu của người dùng thông qua tin nhắn.
C. Tạo ra phản hồi tự nhiên và trôi chảy.
D. Lưu trữ lịch sử trò chuyện.

7. Trong NLP, 'topic modeling′ (mô hình hóa chủ đề) giúp khám phá điều gì trong một tập văn bản?

A. Cảm xúc chung của tập văn bản.
B. Các chủ đề ẩn hoặc tiềm ẩn trong tập văn bản.
C. Cấu trúc ngữ pháp của mỗi văn bản.
D. Các thực thể có tên quan trọng nhất.

8. Mô hình 'Transformer′ đã tạo ra bước đột phá lớn trong NLP, đặc biệt trong nhiệm vụ nào?

A. Phân tích cảm xúc văn bản ngắn.
B. Dịch máy và các tác vụ sinh văn bản tự nhiên.
C. Nhận dạng giọng nói.
D. Phân loại chủ đề văn bản.

9. Trong NLP, 'parsing′ (phân tích cú pháp) đóng vai trò gì?

A. Chuyển đổi văn bản thành giọng nói.
B. Xác định cấu trúc ngữ pháp của câu, phân tích mối quan hệ giữa các từ.
C. Loại bỏ các từ dừng (stop words) khỏi văn bản.
D. Tìm kiếm thông tin liên quan trong một tập văn bản lớn.

10. Trong NLP, 'sequence-to-sequence model′ (mô hình chuỗi-sang-chuỗi) thường được sử dụng cho tác vụ nào?

A. Phân loại văn bản.
B. Dịch máy và tóm tắt văn bản.
C. Phân tích cảm xúc.
D. Nhận dạng thực thể có tên.

11. Trong NLP, 'stop words′ (từ dừng) thường được loại bỏ khỏi văn bản vì lý do gì?

A. Chúng chứa thông tin nhạy cảm.
B. Chúng xuất hiện quá thường xuyên và ít mang ý nghĩa phân biệt.
C. Chúng gây khó khăn cho quá trình tokenization.
D. Chúng chỉ có trong một số ngôn ngữ nhất định.

12. Trong NLP, 'transfer learning′ (học chuyển giao) mang lại lợi ích chính nào?

A. Tăng cường khả năng hiểu ngôn ngữ hình tượng.
B. Cho phép huấn luyện mô hình hiệu quả hơn với ít dữ liệu hơn cho tác vụ mới.
C. Cải thiện khả năng dịch máy cho ngôn ngữ hiếm.
D. Giảm thiểu thiên kiến trong mô hình.

13. Khó khăn chính trong xử lý ngôn ngữ tự nhiên liên quan đến 'tính mơ hồ' (ambiguity) của ngôn ngữ là gì?

A. Ngôn ngữ có quá nhiều từ vựng.
B. Một từ hoặc cụm từ có thể có nhiều nghĩa tùy thuộc vào ngữ cảnh.
C. Máy tính không thể hiểu được cảm xúc.
D. Dữ liệu văn bản thường không có cấu trúc.

14. Trong NLP, 'Named Entity Recognition′ (NER) là quá trình xác định loại thông tin nào trong văn bản?

A. Cảm xúc và thái độ được thể hiện trong văn bản.
B. Các thực thể có tên như người, tổ chức, địa điểm, và thời gian.
C. Chủ đề chính của văn bản.
D. Quan điểm của tác giả về một chủ đề.

15. Kỹ thuật 'Word Embedding′ (nhúng từ) như Word2Vec hoặc GloVe có ưu điểm chính nào so với BoW?

A. Giảm kích thước dữ liệu văn bản đáng kể.
B. Nắm bắt được mối quan hệ ngữ nghĩa giữa các từ.
C. Xử lý văn bản nhanh hơn BoW.
D. Đơn giản hóa quá trình tokenization.

16. Phương pháp 'backpropagation′ (lan truyền ngược) được sử dụng trong huấn luyện mạng nơ-ron sâu cho NLP với mục đích gì?

A. Tăng tốc độ xử lý văn bản.
B. Tính toán và cập nhật trọng số của mạng để giảm thiểu lỗi dự đoán.
C. Phân tích cấu trúc ngữ pháp của câu.
D. Tạo ra biểu diễn vector của từ.

17. Trong NLP, 'zero-shot learning′ đề cập đến khả năng của mô hình như thế nào?

A. Học từ dữ liệu không được gán nhãn.
B. Thực hiện tác vụ mà không cần được huấn luyện trực tiếp trên tác vụ đó.
C. Huấn luyện mô hình chỉ với một lượng nhỏ dữ liệu.
D. Chuyển kiến thức từ ngôn ngữ này sang ngôn ngữ khác.

18. Mục tiêu chính của 'Sentiment Analysis′ (phân tích cảm xúc) trong NLP là gì?

A. Phân loại văn bản theo chủ đề.
B. Xác định cấu trúc ngữ pháp của câu.
C. Xác định ý kiến, thái độ, hoặc cảm xúc được thể hiện trong văn bản.
D. Tóm tắt nội dung chính của văn bản.

19. Ứng dụng nào sau đây KHÔNG phải là một ví dụ trực tiếp của Xử lý ngôn ngữ tự nhiên?

A. Hệ thống dịch máy tự động.
B. Công cụ kiểm tra chính tả và ngữ pháp.
C. Phần mềm chỉnh sửa ảnh kỹ thuật số.
D. Chatbot hỗ trợ khách hàng.

20. Ưu điểm chính của phương pháp 'machine learning NLP′ (NLP học máy) so với 'rule-based NLP′ là gì?

A. Dễ dàng điều chỉnh và mở rộng cho nhiều ngôn ngữ.
B. Khả năng tự động học hỏi và thích ứng từ dữ liệu.
C. Yêu cầu ít dữ liệu huấn luyện hơn.
D. Độ chính xác cao hơn trong mọi trường hợp.

21. Phương pháp 'Bag of Words′ (BoW) trong NLP chủ yếu tập trung vào điều gì?

A. Thứ tự xuất hiện của các từ trong văn bản.
B. Mối quan hệ ngữ nghĩa giữa các từ.
C. Tần suất xuất hiện của mỗi từ trong văn bản.
D. Cấu trúc ngữ pháp của câu.

22. Trong NLP, 'knowledge graph′ (đồ thị tri thức) được sử dụng để biểu diễn điều gì?

A. Cấu trúc ngữ pháp của ngôn ngữ.
B. Mối quan hệ và thực thể trong thế giới thực.
C. Quá trình suy luận logic.
D. Phân bố từ vựng trong văn bản.

23. Trong NLP, 'regular expression′ (biểu thức chính quy) thường được sử dụng cho mục đích gì?

A. Phân tích ngữ nghĩa.
B. Tìm kiếm và trích xuất mẫu văn bản dựa trên quy tắc.
C. Huấn luyện mô hình học máy.
D. Dịch văn bản tự động.

24. Kỹ thuật 'attention mechanism′ (cơ chế chú ý) trong mô hình Transformer giúp cải thiện hiệu suất như thế nào?

A. Giảm thời gian huấn luyện mô hình.
B. Cho phép mô hình tập trung vào các phần quan trọng nhất của đầu vào khi xử lý.
C. Tăng kích thước từ vựng mà mô hình có thể xử lý.
D. Đơn giản hóa cấu trúc mô hình.

25. Trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP), 'tokenization′ đề cập đến quá trình nào?

A. Phân tích ý nghĩa ngữ nghĩa của văn bản.
B. Chia văn bản thành các đơn vị nhỏ hơn, chẳng hạn như từ hoặc cụm từ.
C. Xác định cấu trúc cú pháp của câu.
D. Chuyển đổi văn bản từ ngôn ngữ này sang ngôn ngữ khác.

26. Mục đích của việc sử dụng 'n-gram′ trong NLP là gì?

A. Giảm kích thước từ vựng.
B. Nắm bắt thông tin về thứ tự từ và ngữ cảnh cục bộ.
C. Phân tích cấu trúc ngữ pháp phức tạp.
D. Tăng tốc độ xử lý văn bản.

27. Công cụ nào sau đây thường được sử dụng để trực quan hóa word embeddings (nhúng từ) trong không gian nhiều chiều?

A. TF-IDF.
B. t-SNE (t-distributed Stochastic Neighbor Embedding).
C. BLEU.
D. Regular Expression.

28. Ứng dụng nào sau đây thể hiện việc sử dụng NLP để cải thiện khả năng tiếp cận thông tin cho người khuyết tật?

A. Hệ thống đề xuất sản phẩm trực tuyến.
B. Phần mềm chuyển văn bản thành giọng nói cho người khiếm thị.
C. Công cụ phân tích thị trường chứng khoán.
D. Trò chơi điện tử tương tác.

29. Kỹ thuật 'stemming′ (cắt gốc từ) và 'lemmatization′ (khôi phục nguyên dạng) trong NLP có điểm chung là gì?

A. Đều nhằm mục đích tăng cường tính đa dạng của từ vựng.
B. Đều cố gắng đưa các từ về dạng gốc hoặc dạng chuẩn hóa.
C. Đều tập trung vào việc phân tích ý nghĩa ngữ nghĩa của từ.
D. Đều được sử dụng để cải thiện hiệu suất của dịch máy.

30. Kỹ thuật 'TF-IDF′ (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?

A. Phân tích cảm xúc của văn bản.
B. Đo lường tầm quan trọng của một từ trong một tài liệu so với toàn bộ tập tài liệu.
C. Phân loại văn bản theo chủ đề.
D. Tóm tắt văn bản.

1 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

1. Phương pháp `rule-based NLP′ (NLP dựa trên quy tắc) hoạt động dựa trên điều gì?

2 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

2. Mô hình ngôn ngữ (language model) trong NLP có chức năng chính là gì?

3 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

3. Thách thức đạo đức nào sau đây là một vấn đề quan trọng trong phát triển và ứng dụng NLP?

4 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

4. Kỹ thuật `POS tagging′ (gán nhãn từ loại) trong NLP nhằm mục đích gì?

5 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

5. Metric (độ đo) nào thường được sử dụng để đánh giá hiệu suất của mô hình dịch máy?

6 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

6. Trong ngữ cảnh của chatbot, `intent recognition′ (nhận dạng ý định) là gì?

7 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

7. Trong NLP, `topic modeling′ (mô hình hóa chủ đề) giúp khám phá điều gì trong một tập văn bản?

8 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

8. Mô hình `Transformer′ đã tạo ra bước đột phá lớn trong NLP, đặc biệt trong nhiệm vụ nào?

9 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

9. Trong NLP, `parsing′ (phân tích cú pháp) đóng vai trò gì?

10 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

10. Trong NLP, `sequence-to-sequence model′ (mô hình chuỗi-sang-chuỗi) thường được sử dụng cho tác vụ nào?

11 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

11. Trong NLP, `stop words′ (từ dừng) thường được loại bỏ khỏi văn bản vì lý do gì?

12 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

12. Trong NLP, `transfer learning′ (học chuyển giao) mang lại lợi ích chính nào?

13 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

13. Khó khăn chính trong xử lý ngôn ngữ tự nhiên liên quan đến `tính mơ hồ` (ambiguity) của ngôn ngữ là gì?

14 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

14. Trong NLP, `Named Entity Recognition′ (NER) là quá trình xác định loại thông tin nào trong văn bản?

15 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

15. Kỹ thuật `Word Embedding′ (nhúng từ) như Word2Vec hoặc GloVe có ưu điểm chính nào so với BoW?

16 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

16. Phương pháp `backpropagation′ (lan truyền ngược) được sử dụng trong huấn luyện mạng nơ-ron sâu cho NLP với mục đích gì?

17 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

17. Trong NLP, `zero-shot learning′ đề cập đến khả năng của mô hình như thế nào?

18 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

18. Mục tiêu chính của `Sentiment Analysis′ (phân tích cảm xúc) trong NLP là gì?

19 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

19. Ứng dụng nào sau đây KHÔNG phải là một ví dụ trực tiếp của Xử lý ngôn ngữ tự nhiên?

20 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

20. Ưu điểm chính của phương pháp `machine learning NLP′ (NLP học máy) so với `rule-based NLP′ là gì?

21 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

21. Phương pháp `Bag of Words′ (BoW) trong NLP chủ yếu tập trung vào điều gì?

22 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

22. Trong NLP, `knowledge graph′ (đồ thị tri thức) được sử dụng để biểu diễn điều gì?

23 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

23. Trong NLP, `regular expression′ (biểu thức chính quy) thường được sử dụng cho mục đích gì?

24 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

24. Kỹ thuật `attention mechanism′ (cơ chế chú ý) trong mô hình Transformer giúp cải thiện hiệu suất như thế nào?

25 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

25. Trong lĩnh vực Xử lý ngôn ngữ tự nhiên (NLP), `tokenization′ đề cập đến quá trình nào?

26 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

26. Mục đích của việc sử dụng `n-gram′ trong NLP là gì?

27 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

27. Công cụ nào sau đây thường được sử dụng để trực quan hóa word embeddings (nhúng từ) trong không gian nhiều chiều?

28 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

28. Ứng dụng nào sau đây thể hiện việc sử dụng NLP để cải thiện khả năng tiếp cận thông tin cho người khuyết tật?

29 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

29. Kỹ thuật `stemming′ (cắt gốc từ) và `lemmatization′ (khôi phục nguyên dạng) trong NLP có điểm chung là gì?

30 / 30

Category: Xử lý ngôn ngữ tự nhiên

Tags: Bộ đề 5

30. Kỹ thuật `TF-IDF′ (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì trong NLP?