hồi qui dữ liệu bảng pool ols fem rem trên eviews, hướng dẫn hồi quy đơn giản, được dùng nhiều nhất, các bạn sinh viên rất thích sử dụng, đó là phần mềm eivews. Hồm nay luanvanhay sẽ hướng dẫn các bạn hồi quy dữ liệu bảng ( data panel) trên phần mềm thống kê này.
Dữ liệu bảng là gì ? (panel data)
Dữ liệu bảng là sự kết quả của dữ liệu chéo ( cross section ) và dữ liệu thời gian (time series). Để thu thập dữ liệu bảng, phải thu thập nhiều đối tượng (units) giống nhau trong nhiều thời điểm. Trong điều kiện với dữ liệu bảng, mô hình phân tích hồi quy sẽ là mô hình hồi qui dữ liệu bảng.
Một định nghĩa khác như sau:
Trong thống kê và kinh tế lượng, panel data hay số liệu hỗn hợp (hay dữ liệu bảng) là cách gọi dành cho cơ sở dữ liệu nhiều chiều. Số liệu hỗn hợp gồm các quan sát về nhiều biến rút ra qua nhiều thời điểm khác nhau. Dữ liệu chuỗi thời gian và dữ liệu chéo là các trường hợp đặc biệt của số liệu hỗn hợp khi mà chỉ xet một chiều.
Hồi qui dữ liệu bảng là gì ?
Hồi qui dữ liệu bảng tức là phân tích dữ liệu bảng này.
Phân tích bảng (dữ liệu) là một phương pháp thống kê, được sử dụng rộng rãi trong khoa học xã hội , dịch tễ học và kinh tế lượng để phân tích dữ liệu bảng hai chiều (thường là mặt cắt ngang và dọc) . [1] Dữ liệu thường được thu thập theo thời gian và trên cùng một cá nhân và sau đó hồi quy được thực hiện trên hai chiều này. Phân tích đa chiều là một phương pháp kinh tế lượng trong đó dữ liệu được thu thập qua hơn hai chiều (thông thường, thời gian, cá nhân và một số chiều thứ ba). [2]
Một mô hình hồi quy dữ liệu bảng điều khiển phổ biến trông giống như {\ displaystyle y_ {it} = a + bx_ {it} + \ varepsilon _ {it}} {\ displaystyle y_ {it} = a + bx_ {it} + \ varepsilon _ {it}}, trong đó y là biến phụ thuộc , x là biến độc lập , a và b là hệ số, i và t là chỉ số cho các cá nhân và thời gian. Lỗi {\ displaystyle \ varepsilon _ {it}} {\ displaystyle \ varepsilon _ {it}}là rất quan trọng trong phân tích này. Giả định về thuật ngữ lỗi xác định xem chúng ta nói về hiệu ứng cố định hay hiệu ứng ngẫu nhiên. Trong một mô hình hiệu ứng cố định, {\ displaystyle \ varepsilon _ {it}} {\ displaystyle \ varepsilon _ {it}} được giả định là thay đổi không ngẫu nhiên hơn {\ displaystyle i} tôi hoặc là {\ displaystyle t} tlàm cho mô hình hiệu ứng cố định tương tự như mô hình biến giả trong một chiều. Trong một mô hình hiệu ứng ngẫu nhiên, {\ displaystyle \ varepsilon _ {it}} {\ displaystyle \ varepsilon _ {it}} được giả định là thay đổi ngẫu nhiên trên {\ displaystyle i} tôi hoặc là {\ displaystyle t} tyêu cầu xử lý đặc biệt của ma trận phương sai lỗi. [3]
Phân tích dữ liệu bảng có ba cách tiếp cận độc lập nhiều hơn hoặc ít hơn:
- bảng điều khiển độc lập;
- mô hình hiệu ứng ngẫu nhiên ;
- mô hình hiệu ứng cố định hoặc mô hình khác biệt đầu tiên.
Việc lựa chọn giữa các phương pháp này phụ thuộc vào mục tiêu của phân tích và các vấn đề liên quan đến tính ngoại sinh của các biến giải thích.
Sau khi xem qua vài khái niệm chúng ta bắt đầu vào cuộc phân tích hồi quy dữ liệu bảng trên phần mềm eviews
Mô hình Pool OLS
Mô hình này thực chất là mô hình OLS bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mấy dữ liệu bình thường. Tức là chúng ta không phân biệt theo năm và theo đối tượng. Do đó kết quả hồi quy không được tin cậy.
Mô hình tác động cố định FEM
Trong mô hình tác động cố định FEM. Phần dư của mô hình hồi quy tuyến tính được tách ra 2 thành phần ( redid = x +y). Thành phần x đại điện cho các yếu tố không quan sát được khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian. thành phần y đại diện đại diện cho những yếu tố không quan sát được khác nhau giữa các đối tượng và thay đổi theo thời gian.
Mô hình tác động ngẫu nhiên REM
Cũng giống như định nghĩa trên, nhưng có điểm này khác biệt: Thành phần x đại điện cho các yếu tố không quan sát được khác nhau giữa các đối tượng không thay đổi theo thời gian.
Một giả định quan trọng nữa là trong phần dư y không tương quan với bất kỳ biến giải thích nào trong mô hình.
Ưu điểm cho mô hình hồi quy tác động cố định và ngẫu nhiên
Cho kết quả ước lượng với các tham số trong mô hình tin cậy hơn hồi quy pool ols vì cho phép chúng ta kiểm soát các yếu tố không quan sát được. Các yếu tố này có thể khác nhau giữa các đối tượng nhưng không thay đổi theo thời gian nhưng lại không khác nhau giữa các đối tượng.
Cho phép chúng ta xác định và đo lường mà những tác động này không thể được xác định và đo lường khi sử dụng dữ liệu chéo hoặc dữ liệu thời gian.
Kiểm định hausman
Kiểm định hausman là phương pháp lựa chọn mô hình hồi quy dữ liệu bảng tốt nhất, Thực hiện kiểm định Hausman, căn cứ vào giá trị ucar Prob, để kết luận. Nếu Prob. <0.05 thì bác bỏ giả thuyết H0 và chấp nhận giả thuyết H1, có nghĩa là trong trường hợp này ta chấp nhận giả thuyết H1 là sử dụng mô hình tác động cố định FEM và phù hợp và ngược lại.
Lý giải kết quả.
Đã nói qua về lý thuyết và ứng dụng vào mô hình rồi, nhưng quan trọng hơn hết là chúng ta có thể đọc được và diễn giải kết quả. Chúng ta xem bảng Kiểm định hausman ta có, p-value = 0.00, tức là <0.05; Vì vậy chúng ta bác bỏ giải thuyết H0 và chập nhận giả thuyết H1, có nghĩa là mô hình tác động cố định hiệu quả.
Ta xét bảng hồi quy FEM, ta có chỉ số R-Squared là 0.8685, tức là các biến độc lập ảnh hưởng đến biến phụ thuộc là 86,85%; Hay nói cách khác là mức độ giải thích biến phụ thuộc bởi các biến độc lập là 86%, còn lại 14% là các biến khác.
Tiếp theo ta xét giá trị Prob với 5%, ta có 3 biến LEV, FS, AQ là không có ý nghĩa thống kê.
Khi biến BS5 tăng 1 đơn vị thì DA tăng 126,5 đơn. Tương tự biện luận các biến còn lại.
Trên đây là hướng dẫn hồi quy dữ liệu bảng giữa lựa chọn Pool ols, fem rem trên phần mềm eviews 10.
Vài lưu ý
Mở dữ liệu: File > Open > Foreign Data as Workfile ( trỏ về file excel)
Step1 => Step2 => Step3 ( check biến thời gian) => Step3( basic structure : date panel) => finish.
Còn lại là thao tác hồi quy như bình thường, trong mục Panle Option lựa chọn mô hình theo yêu cầu của mình.
Nếu còn thắc mắc gì về hồi qui dữ liệu bảng, các bạn để lại commnet bên dưới, chúng ta cùng thảo luận. thanks.