Phân biệt biến gây nhiễu (Confounding variable) với biến ngoại lai (Extraneous Variables) trong nhiên cứu thống kê khoa học; Để tìm ra biến gây nhiễu là một việc làm quan trọng giúp cho công việc hồi quy của chúng ta sẽ đạt được kết quả tốt hơn nhiều.
Biến gây nhiễu – Confounding Variable
Biến gây nhiễu là gì ?
Trong nghiên cứu điều tra mối quan hệ nguyên nhân và kết quả tiềm ẩn, một biến gây tạo nhiễu là một biến thứ ba không đo lường được có ảnh hưởng đến cả nguyên nhân được cho là và kết quả được cho là.
Điều quan trọng là phải xem xét các biến tạo nhiễu tiềm ẩn và giải thích chúng trong thiết kế nghiên cứu của bạn để đảm bảo kết quả của bạn là hợp lệ .
Định nghĩa biến nhiễu
Biến gây tạo nhiễu là một biến “ phụ” mà bạn không tính đến. Chúng có thể làm hỏng một cuộc thử nghiệm và mang lại cho bạn những kết quả vô ích. Họ có thể gợi ý rằng có sự tương quan trong khi thực tế là không có. Họ thậm chí có thể giới thiệu sự thiên vị . Đó là lý do tại sao điều quan trọng là phải biết chúng là gì và làm thế nào để tránh đưa chúng vào thử nghiệm của bạn ngay từ đầu.
Cách nhận biết Confounding Variables
Trong một thử nghiệm, biến độc lập thường có ảnh hưởng đến biến phụ thuộc của bạn . Ví dụ: nếu bạn đang nghiên cứu xem liệu thiếu tập thể dục có dẫn đến tăng cân hay không, thì thiếu tập thể dục là biến số độc lập của bạn và tăng cân là biến số phụ thuộc của bạn. Biến gây nhầm lẫn là bất kỳ biến nào khác cũng có ảnh hưởng đến biến phụ thuộc của bạn. Chúng giống như các biến độc lập phụ đang có tác động ẩn lên các biến phụ thuộc của bạn. Các biến gây nhầm lẫn có thể gây ra hai vấn đề lớn:
- Tăng phương sai ( Variance)
- Tạo ra sai lệch / thiên vị (Bias)
Biến nhiễu là gì?
Biến gây nhiễu (hay còn gọi là yếu tố gây nhiễu) là một loại biến ngoại lai có liên quan đến các biến phụ thuộc và độc lập của một nghiên cứu . Một biến phải đáp ứng hai điều kiện để trở thành một yếu tố gây nhiễu:
- Nó phải được tương quan với biến độc lập. Đây có thể là mối quan hệ nhân quả, nhưng không nhất thiết phải như vậy.
- Nó phải có quan hệ nhân quả với biến phụ thuộc.
Tại sao các biến tạo nhiễu lại quan trọng
Để đảm bảo giá trị nội bộ của nghiên cứu của bạn, bạn phải tính đến các biến nhiễu. Nếu bạn không làm như vậy, kết quả của bạn có thể không phản ánh mối quan hệ thực tế giữa các biến mà bạn quan tâm ..
Ví dụ: bạn có thể thấy mối quan hệ nguyên nhân và kết quả không thực sự tồn tại, bởi vì tác động mà bạn đo lường được gây ra bởi biến nhiễu (chứ không phải bởi biến độc lập của bạn).
Ngay cả khi bạn xác định đúng mối quan hệ nguyên nhân và kết quả, các biến gây nhiễu có thể dẫn đến đánh giá quá mức hoặc đánh giá thấp tác động của biến độc lập lên biến phụ thuộc của bạn.
Cách giảm tác động của các biến gây nhiễu
Có một số phương pháp tính toán các biến nhiễu. Bạn có thể sử dụng các phương pháp sau khi nghiên cứu bất kỳ loại đối tượng nào — con người, động vật, thực vật, hóa chất, v.v. Mỗi phương pháp đều có ưu và nhược điểm riêng.
Sự hạn chế
Trong phương pháp này, bạn hạn chế nhóm điều trị của mình bằng cách chỉ bao gồm các đối tượng có cùng giá trị của các yếu tố gây nhiễu tiềm ẩn.
Vì những giá trị này không khác nhau giữa các đối tượng nghiên cứu của bạn, chúng không thể tương quan với biến độc lập của bạn và do đó không thể làm xáo trộn mối quan hệ nguyên nhân và kết quả mà bạn đang nghiên cứu.
- Tương đối dễ thực hiện
- Hạn chế mẫu của bạn rất nhiều
- Bạn có thể không xem xét các yếu tố gây nhiễu tiềm ẩn khác
Phù hợp
Trong phương pháp này, bạn chọn một nhóm so sánh phù hợp với nhóm điều trị. Mỗi thành viên của nhóm so sánh nên có một đối chứng trong nhóm điều trị có cùng giá trị của các yếu tố gây nhiễu tiềm ẩn, nhưng các giá trị biến độc lập khác nhau.
Điều này cho phép bạn loại bỏ khả năng sự khác biệt về các biến tạo nhiễu gây ra sự khác biệt về kết quả giữa nhóm điều trị và nhóm so sánh. Do đó, nếu bạn đã tính đến bất kỳ yếu tố gây nhiễu tiềm ẩn nào, bạn có thể kết luận rằng sự khác biệt trong biến độc lập phải là nguyên nhân của sự thay đổi trong biến phụ thuộc.
- Cho phép bạn bao gồm nhiều đối tượng hơn là giới hạn
- Có thể chứng minh là khó thực hiện vì bạn cần các cặp đối tượng phù hợp trên mọi biến gây nhiễu tiềm năng
- Các biến khác mà bạn không thể so khớp cũng có thể là các biến gây tạo nhiễu
Kiểm soát thống kê
Nếu bạn đã thu thập dữ liệu, bạn có thể bao gồm các yếu tố gây nhiễu có thể làm biến kiểm soát trong các mô hình hồi quy của mình ; bằng cách này, bạn sẽ kiểm soát được tác động của biến gây nhiễu.
Bất kỳ tác động nào mà biến tạo nhiễu tiềm ẩn có trên biến phụ thuộc sẽ hiển thị trong kết quả của hồi quy và cho phép bạn tách tác động của biến độc lập.
- Dễ để thực hiện
- Có thể được thực hiện sau khi thu thập dữ liệu
- Bạn chỉ có thể kiểm soát các biến mà bạn quan sát trực tiếp, nhưng các biến gây nhiễu khác mà bạn chưa tính đến có thể vẫn còn
Ngẫu nhiên hóa
Một cách khác để giảm thiểu tác động của các biến gây nhiễu là ngẫu nhiên hóa các giá trị của biến độc lập của bạn. Ví dụ: nếu một số người tham gia của bạn được chỉ định vào một nhóm điều trị trong khi những người khác thuộc nhóm đối chứng , bạn có thể chỉ định ngẫu nhiên những người tham gia vào mỗi nhóm.
Việc ngẫu nhiên hóa đảm bảo rằng với một mẫu đủ lớn, tất cả các biến gây phát nhiễu tiềm ẩn — ngay cả những biến mà bạn không thể quan sát trực tiếp trong nghiên cứu của mình — sẽ có cùng giá trị trung bình giữa các nhóm khác nhau. Vì các biến này không khác nhau theo cách phân công nhóm, chúng không thể tương quan với biến độc lập của bạn và do đó không thể làm xáo trộn nghiên cứu của bạn.
Vì phương pháp này cho phép bạn tính đến tất cả các biến gây nhiễu tiềm ẩn, điều này gần như không thể làm được, nên nó thường được coi là cách tốt nhất để giảm tác động của các biến gây nhiễu.
- Cho phép bạn tính đến tất cả các biến có thể gây nhiễu, bao gồm cả những biến mà bạn có thể không quan sát trực tiếp
- Được coi là phương pháp tốt nhất để giảm thiểu tác động của các biến gây phát nhiễu
- Khó thực hiện nhất
- Phải được triển khai trước khi bắt đầu thu thập dữ liệu
- Bạn phải đảm bảo rằng chỉ những người trong nhóm điều trị (chứ không phải nhóm kiểm soát) mới được điều trị