1. Ưu điểm chính của việc sử dụng cỡ mẫu lớn trong nghiên cứu định lượng là gì?
A. Giảm chi phí và thời gian nghiên cứu
B. Tăng tính đại diện của mẫu và độ chính xác của ước lượng
C. Đơn giản hóa quá trình phân tích dữ liệu
D. Đảm bảo tính giá trị nội tại của nghiên cứu
2. Trong nghiên cứu khoa học xã hội, loại thang đo nào cho phép xếp hạng thứ tự các biến nhưng không xác định được khoảng cách bằng nhau giữa các thứ hạng?
A. Thang đo định danh (Nominal)
B. Thang đo thứ bậc (Ordinal)
C. Thang đo khoảng (Interval)
D. Thang đo tỷ lệ (Ratio)
3. Ý nghĩa của giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất giả thuyết H0 là đúng
B. Xác suất quan sát được kết quả cực đoan như mẫu, giả sử H0 đúng
C. Xác suất giả thuyết H1 là đúng
D. Ngưỡng ý nghĩa thống kê mặc định
4. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 thực sự đúng
B. Bác bỏ giả thuyết H0 khi H0 thực sự đúng
C. Chấp nhận giả thuyết H0 khi H0 thực sự sai
D. Bác bỏ giả thuyết H0 khi H0 thực sự sai
5. Khi nào thì trung vị (Median) là thước đo xu hướng trung tâm tốt hơn so với trung bình cộng (Mean)?
A. Khi dữ liệu có phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ
C. Khi dữ liệu là biến định tính
D. Khi kích thước mẫu lớn
6. Mục đích chính của thống kê suy luận (Inferential statistics) là gì?
A. Mô tả và tóm tắt dữ liệu mẫu
B. Suy rộng kết quả từ mẫu lên quần thể
C. Tính toán các độ đo xu hướng trung tâm và độ phân tán
D. Trực quan hóa dữ liệu bằng biểu đồ và đồ thị
7. Trong thống kê mô tả, 'phương sai′ (Variance) đo lường điều gì?
A. Giá trị trung tâm của dữ liệu
B. Độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Hình dạng phân phối của dữ liệu
D. Mức độ lệch của phân phối dữ liệu
8. Giá trị trung bình cộng (Mean) bị ảnh hưởng nhiều nhất bởi yếu tố nào sau đây?
A. Số lượng quan sát trong mẫu
B. Độ lệch chuẩn của mẫu
C. Giá trị ngoại lệ (Outliers)
D. Kích thước của quần thể
9. Trong phân tích hồi quy đa biến, điều gì xảy ra khi có hiện tượng đa cộng tuyến (Multicollinearity)?
A. Mô hình hồi quy trở nên không còn ý nghĩa
B. Các hệ số hồi quy trở nên không ổn định và khó diễn giải
C. Sai số chuẩn của các hệ số hồi quy giảm đáng kể
D. R bình phương tăng lên rất cao
10. Trong nghiên cứu khoa học xã hội, khái niệm 'tính giá trị nội tại′ (Internal validity) đề cập đến điều gì?
A. Khả năng suy rộng kết quả nghiên cứu cho quần thể lớn hơn
B. Mức độ chắc chắn rằng mối quan hệ nhân quả quan sát được là thật, không bị ảnh hưởng bởi các biến nhiễu
C. Tính nhất quán của kết quả đo lường qua thời gian
D. Mức độ phù hợp của phương pháp nghiên cứu với câu hỏi nghiên cứu
11. Phương pháp nào sau đây KHÔNG phải là phương pháp chọn mẫu ngẫu nhiên?
A. Chọn mẫu ngẫu nhiên đơn giản
B. Chọn mẫu phân tầng
C. Chọn mẫu cụm
D. Chọn mẫu thuận tiện
12. Giả sử bạn muốn nghiên cứu về 'mức độ hài lòng của sinh viên về chất lượng đào tạo′. Biến 'mức độ hài lòng′ nên được đo bằng thang đo nào?
A. Thang đo định danh (Nominal)
B. Thang đo thứ bậc (Ordinal)
C. Thang đo khoảng (Interval)
D. Thang đo tỷ lệ (Ratio)
13. Trong phân tích dữ liệu định tính, 'mã hóa′ (Coding) dữ liệu là quá trình như thế nào?
A. Chuyển đổi dữ liệu văn bản thành số liệu thống kê
B. Phân loại và gán nhãn cho các đoạn dữ liệu theo chủ đề hoặc ý nghĩa
C. Kiểm tra độ tin cậy và giá trị của dữ liệu
D. Tổng hợp và trình bày kết quả nghiên cứu
14. Trong kiểm định giả thuyết, 'mức ý nghĩa′ (Significance level - alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc sai số loại II là 5%
B. Xác suất mắc sai số loại I là 5%
C. Độ tin cậy của kết quả là 95%
D. Cả đáp án 2 và 3
15. Khi nào nên sử dụng kiểm định ANOVA thay vì kiểm định t-Student?
A. Khi so sánh trung bình của hai nhóm
B. Khi so sánh trung bình của ba nhóm trở lên
C. Khi biến phụ thuộc là biến định tính
D. Khi kích thước mẫu nhỏ hơn 30
16. Trong nghiên cứu khoa học xã hội, đạo đức nghiên cứu yêu cầu điều gì liên quan đến dữ liệu thống kê?
A. Bảo mật thông tin cá nhân của người tham gia
B. Công bố kết quả nghiên cứu dù kết quả âm tính
C. Sử dụng thống kê để chứng minh giả thuyết bằng mọi giá
D. Cả đáp án 1 và 2
17. Chọn mẫu ngẫu nhiên đơn giản (Simple random sampling) đảm bảo điều gì?
A. Mẫu phản ánh chính xác đặc điểm của quần thể
B. Mỗi cá thể trong quần thể có cơ hội được chọn vào mẫu như nhau
C. Mẫu có kích thước đủ lớn để suy rộng cho quần thể
D. Mẫu bao gồm tất cả các nhóm nhỏ trong quần thể
18. Trong thống kê mô tả, 'mốt′ (Mode) là gì?
A. Giá trị trung bình cộng của dữ liệu
B. Giá trị ở giữa của dữ liệu đã sắp xếp
C. Giá trị xuất hiện nhiều nhất trong dữ liệu
D. Độ lệch chuẩn của dữ liệu
19. Biến 'gây nhiễu′ (Confounding variable) ảnh hưởng đến mối quan hệ giữa biến độc lập và biến phụ thuộc như thế nào?
A. Làm tăng cường mối quan hệ thực sự
B. Làm yếu đi mối quan hệ thực sự
C. Gây ra một mối quan hệ giả tạo hoặc che giấu mối quan hệ thực sự
D. Không ảnh hưởng đến mối quan hệ
20. Loại biểu đồ nào phù hợp nhất để thể hiện tần suất của các biến định tính?
A. Biểu đồ tán xạ (Scatter plot)
B. Biểu đồ đường (Line chart)
C. Biểu đồ cột (Bar chart) hoặc Biểu đồ tròn (Pie chart)
D. Biểu đồ hộp (Box plot)
21. Trong nghiên cứu định lượng, 'độ tin cậy′ (Reliability) của một công cụ đo lường đề cập đến điều gì?
A. Khả năng đo lường chính xác khái niệm nghiên cứu
B. Khả năng tạo ra kết quả nhất quán khi đo lặp lại
C. Mức độ phù hợp với đạo đức nghiên cứu
D. Tính đại diện của mẫu nghiên cứu
22. Khi thực hiện phân tích hồi quy, điều gì cần được kiểm tra để đảm bảo tính hợp lệ của mô hình?
A. Kích thước mẫu
B. Giả định về sai số (ví dụ: tính tuyến tính, tính độc lập, phương sai không đổi)
C. Giá trị p của các hệ số
D. Hệ số R bình phương
23. Khi nào thì kiểm định phi tham số (Non-parametric test) được ưu tiên sử dụng hơn so với kiểm định tham số (Parametric test)?
A. Khi dữ liệu có phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi giả định về phân phối của quần thể không được đáp ứng
D. Khi cần so sánh trung bình của nhiều nhóm
24. Để giảm thiểu sai số chọn mẫu, biện pháp nào sau đây là hiệu quả nhất?
A. Tăng cường kiểm soát quá trình thu thập dữ liệu
B. Tăng kích thước mẫu
C. Sử dụng phương pháp chọn mẫu phi ngẫu nhiên
D. Giảm độ phức tạp của công cụ đo lường
25. Khi báo cáo kết quả kiểm định giả thuyết, mức ý nghĩa thống kê (ví dụ p < 0.05) cho biết điều gì?
A. Mối quan hệ giữa các biến là mạnh mẽ
B. Kết quả có ý nghĩa quan trọng về mặt thực tiễn
C. Có đủ bằng chứng để bác bỏ giả thuyết H0 ở mức ý nghĩa đã chọn
D. Giả thuyết H0 chắc chắn là sai
26. Trong phân tích hồi quy tuyến tính, hệ số R bình phương (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
C. Độ dốc của đường hồi quy
D. Sai số chuẩn của ước lượng
27. Hệ số tương quan Pearson (Pearson correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1
B. Từ -1 đến 1
C. Từ -∞ đến +∞
D. Từ 0 đến ∞
28. Phương pháp thống kê nào thường được sử dụng để kiểm tra mối quan hệ giữa hai biến định tính?
A. Phân tích hồi quy tuyến tính
B. Kiểm định t-Student
C. Kiểm định Chi bình phương (Chi-square)
D. Phân tích phương sai (ANOVA)
29. Trong nghiên cứu khoa học xã hội, việc 'vận hành hóa′ (Operationalization) một khái niệm có nghĩa là gì?
A. Định nghĩa khái niệm một cách trừu tượng và lý thuyết
B. Biến khái niệm trừu tượng thành các biến số có thể đo lường được
C. Xác định mối quan hệ nhân quả giữa các khái niệm
D. Đánh giá tính giá trị và độ tin cậy của khái niệm
30. Phân phối chuẩn (Normal distribution) có đặc điểm gì?
A. Đối xứng và có một đỉnh duy nhất ở giữa
B. Lệch trái hoặc lệch phải
C. Có nhiều đỉnh
D. Dữ liệu phân bố đều trên toàn bộ khoảng giá trị