Hiệu chỉnh data biến tương tác, hay còn goi là biến modify variable, hay interaction variable hay DID ( Difference-in-differences), trong bài viết này chúng ta không tìm hiểu cụ thể từng loại biến và các đọc kết quả của nó mà chúng ta chỉ học cách chạy từng loại biến tương tác trong Stata, ở đây chúng tôi sẽ sử dụng chuẩn là hồi quy ols, các bạn có thể sử dụng với nhiều hồi quy khác nhau, nhằm tăng cao mục tiêu nghiên cứu của mình.
BIẾN TƯƠNG TÁC:
MODIFY VAR + INTERACTION VAR + DID
Biến tương tác là gì ?
Một biến tương tác hoặc tương tác đặc trưng là một biến được xây dựng từ bộ hồ sơ gốc của các biến để cố gắng đại diện cho một trong hai tất cả các hiện tương tác hoặc một số phần của nó. Trong phân tích thống kê khám phá, người ta thường sử dụng các sản phẩm của các biến gốc làm cơ sở để kiểm tra xem liệu tương tác có hiện diện với khả năng thay thế các biến tương tác khác thực tế hơn ở giai đoạn sau hay không.
Khi có nhiều hơn hai biến giải thích, một số biến tương tác được xây dựng, với các sản phẩm theo cặp đại diện cho các tương tác theo cặp và các sản phẩm bậc cao đại diện cho các tương tác bậc cao hơn.
Nói nôm na: ta dùng dữ liệu biến củ để tạo ra biến mới.
Thông kê dữ liệu
Chúng ta có dữ liệu như sau:
- Ta có biến LnY (Thu nhập) + LAND (Đất) + LEND (Cho vay) là biến liên tục
- Biến GENDER (Giới tính) + KHMER (Dân tộc) là biến rời rạc nhị phân
- Biến EDU(Giáo dục) là biến rời rạc thứ bậc.
Để chạy biến tương tác thì chúng ta phải hiểu rỏ thành phần cấu tạo nên biến.
Giờ thì chúng ta hồi quy OLS bình thường, để tìm mối quan hệ và được kết quả như sau:
Ta được 3 biến có tác động là EDU, LAND, LEND vì có ý nghĩa thống kê.
Biến Mod là biến thứ bậc
Trong mô hình hồi quy ols ở trên ta xem biến EDU như là biến định lượng, như vậy có nghĩa là thứ bậc của học vấn có ảnh hưởng đến LnY, nếu như thế thì ta nên để là số năm đi học luôn đi, phân nhóm ra để làm gì ? Mục đích của tác giả là muốn biến, người đi học cấp 1 với người không đi học thì có sự khác biệt anh về thu nhập LnY hay không ?
Vấn đề sai lầm này, không phải bạn mà rất nhiều người làm khoa học mắc phải, cứ hồi quy biến rời rạc như là biến liên tục, dẫn đến hiểu sai kết quả hồi quy; Vì vậy trong trường hợp này chúng ta sử dụng biến rời rạc làm biến tương tác:
Ta hồi quy như thế này, thì mới đúng ý tưởng của biến thứ bậc, chúng ta sẽ thấy sự khác biệt giữa bậc học từ cấp 1 – 5 so với người không đi học thì có khác biệt hay không ? Trong ví dụ trên thì chúng ta sẽ không có thấy sự khác biệt gữa các cấp học với người không biết chữ.
Làm tương tác từ 2 biến nhị phân
Tiếp theo tôi muốn biết nếu Giới tính là nữ và là người dân tộc Khmer thì thu nhập của họ như thế nào ?
Các bạn nên nhớ rằng các biến nằm bên tay phải ta có thể gọi là: biến độc lập, biến điều tiết, biến điều khiển …. ta gọi chung là biến độc lập và nó gắn liền với giả thuyết là không có mối tương quan nào với nhau. Bởi vậy với giả thuyết như trên thì bạn sẽ không bao giờ làm được từ dữ liệu có sẵn, chỉ có cách khác là tạo biến theo yêu cầu. Rất may Stata có thể nhanh chóng giúp chúng ta, với câu lệnh sau:
Các bạn nên nhớ khi tạo biến tương tác ( biến mod) thì nó phải có ý nghĩa thống kê, còn nếu không có thì không cần phải tạo ra làm gì ? ở đây do chúng tôi chuẩn bị đại khái 1 bộ dữ liệu để các bạn dễ dàng nhìn thấy kết quả hồi quy biến tương tác như trên.
Làm biến tương tác từ 2 biến liên tục
Giống như trên bây giờ ta đặt giả thuyết cho các bạn dễ hiểu: tôi muốn biết những người có nhiều đất và cho vay thì thu nhập của họ như thế nào ?
Thay vì phải tạo dữ liệu biến thêm vào, thì Stata đã cung cấp sẵn sàn cho chúng ta thấy điều này. Với câu lệnh tương đối đơn giản:
Nó quá dễ dàng phải không các bạn, tiếp theo
Tạo biến tương tác từ 1 biến nhị phân với 1 biến liên tục.
Đặt giả thuyết: Giới tính và số lượng của chủ đất có ảnh hưởng như thế nào đến thu nhập, trong hồi quy ols thì ta thấy rằng, giới tính không tác động, lượng đất thì tác động, như vậy thì với giả thuyết như thế thì phải hồi quy như thế nào ?
Cũng rất đơn giản Stata sẽ giúp chúng ta:
Kết quả nghiên cứu cho ta thấy rằng, chủ đất là nữ hay là nam nếu có đất nhiều điều tác động mạnh mẽ đế thu nhập.
Dịch vụ làm data biến tương tác
Ứng dụng biến tương tác hết sức rộng rãi và lâu dài, nhưng hiện tại ở VN thì chưa ứng dụng nhiều và còn khá mới mẽ, được biệt là mô hình DID, nếu các bạn gặp khó khăn trong việc tạo ra biến tương tác, hay biến tương tác không có ý nghĩa thống kê, bạn cần xử lý số liệu, các bạn đừng lo lắng hãy liên hệ ngay với chúng tôi, để được tư vấn và hỗ trợ kịp thời thời nhất.
Nếu các bạn không làm biến tương tác thì thôi, nếu làm thì phải có ý nghĩa thống kê, làm mà không có ý nghĩa thống kê thì “rất dị” nha các bạn.