phát hiện dữ liệu có tính dừng và đồng liên kết

phát hiện dữ liệu có tính dừng và đồng liên kết, hướng dẫn các xác định chuỗi dữ liệu trong mô hình thời gian có tính ổn định hay không – hoặc là tính dừng, đồng thời chúng ta xem xét thêm trường hợp mới là đồng liên kết trong mô hình có tính thời gian. Dữ liệu chuỗi thời gian là một trong những chuỗi dữ liệu quan trọng và tính thực tế cao, nhưng nhiều nguyên nhân vẫn chưa được các bạn sinh viên hay nghiên cứu sinh ứng dụng vào luận văn. Hôm nay chúng tôi, sẽ giới thiệu đến các bạn hai tính năng của chuỗi dữ liệu có liên quan đến thời gian là dữ liệu có tính dừng và đồng liên kết.

Trước khi chúng ta xem xét dữ liệu có tính dừng là gì và đồng liên kết là gì; thì có một vấn đề khác rất quan trọng để xem xét trước tiên đó là, độ trễ của dữ liệu (lag). Trong những ví dụ ở bài viết này chúng tôi sử dụng toàn bộ trên phần mềm stata đồng thời sử dụng cơ sở dữ liệu:

use http://solieu.vip/data/muanha.dta, clear

Độ trễ (lag)  là gì ?

Ví dụ có dễ hiểu về độ trễ, như ta đầu tư một trang thiết bị x vào quy trình sản xuất, thì khoảng bao lâu trang thiết bị x này có tác dụng đến lợi nhuận của công ty.

Vậy độ trễ là khoảng thời gian chưa kịp đáp ứng với dữ liệu hay hoạt động hiện tại

Để kiểm tra độ lag trên stata chúng ta sử dụng lên varsoc, bây giờ chúng ta sẽ kiểm tra độ trễ của biến DTICH

varsoc DTICH, maxlag(10)

và chúng ta được kết quả sau:

varsoc DTICH 300x163 - phát hiện dữ liệu có tính dừng và đồng liên kết
kiểm tra lag

Trong bảng kiểm tra độ lag ở trên chúng ta dễ dàng nhận thấy rằng, dữ liệu DTICH của cũng ta bị trẽ ở lag(1), lag(3), lag(9). Những dòng mà bảng đánh dấu (*) là nơi đó có độ trễ.

Dữ liệu có tính dừng hay còn gọi là chuỗi dừng là gì ?

Chuỗi dừng hay tính dừng có tiếng anh là stationary, từ nghĩa tiếng anh để tính chất của dữ liệu này, chúng ta có thể sử dụng khái niệm khác dễ hiểu và chính xác hơn là chuỗi ổn định hay dữ liệu ổn định. Và khi ta hiểu là dữ liệu ổn định quá dễ hiểu cho đặc tính này khi thực tế áp dụng.

Vậy chuỗi ổn định là chuỗi các giá trị quan sát quay quanh giá trị trung bình và có phương sai không đổi.

Cách phát hiện tính ổn định

Đọc qua lý thuyết và ví dụ nếu bạn chưa rõ, thì các bạn có thể vẽ biểu đồ. Nhưng vẽ biểu đồ thì đồ hỏi các bạn phải có kinh nghiệm để nhận biết, tại vì không phải lúc nào biểu đồ cũng dễ hiểu. Trong stata có lệnh để kiểm tra tính ổn định của dữ liệu bằng kiểm định Dickey-Fuller

dfuller GIADV, lag(1)

chuoiondinh 300x88 - phát hiện dữ liệu có tính dừng và đồng liên kết
kiểm tra tính dừng

Ta xét giá trị Test statatistic ( Gọi tắt là Test) với 1% Critical Value ( Gọi tắt là Value). Nếu giá trị tuyệt đối của Test > Giá trị tuyệt đối của Value, thì dữ liệu có tính dừng, tính ổn định, chuỗi dừng, chuỗi ổn định.

Khi dùng dữ liệu ổn định, mà chúng ta sử dụng kiểm định Dickey Fuller thì không thấy sự khác biệt, còn các bạn nào kiểm định bằng đồ thì sẽ dễ dàng hiểu được hơn.

Tính ổn định của sử dụng của thể sử dụng trong bộ dữ liệu hồi quy panel hay hồi quy logit.

Đồng liên kết ( Co-integration ) là gì ?

Trước tien ta xem wiki định nghĩa như sau:

Cointegration là một thuộc tính thống kê của một tập hợp 1 ,  2 , …,  k ) của các biến chuỗi thời gian . Đầu tiên, tất cả các chuỗi phải được tích hợp theo thứ tự d (xem Thứ tự tích hợp ). Tiếp theo, nếu một tổ hợp tuyến tính của bộ sưu tập này được tích hợp theo thứ tự nhỏ hơn d, thì bộ sưu tập được cho là hợp nhất. Chính thức, nếu ( X , Y , Z ) được tích hợp theo thứ tự d và tồn tại các hệ số a , b ,c mà ax  +  by  +  cz được tích hợp trật tự ít hơn d, sau đó X , Y , và Z được cùng hội nhập. Cointegration đã trở thành một tài sản quan trọng trong phân tích chuỗi thời gian đương đại. Chuỗi thời gian thường có xu hướng Xu hướng xác định hoặc ngẫu nhiên . Trong một bài báo có ảnh hưởng, Charles Nelson và Charles Plosser (1982) đã cung cấp bằng chứng thống kê rằng nhiều chuỗi thời gian kinh tế vĩ mô của Mỹ (như GNP, tiền lương, việc làm, v.v.) có xu hướng ngẫu nhiên, những thứ này còn được gọi là quy trình gốc đơn vị, hoặc quy trình được tích hợp theo thứ tự{\ displaystyle 1: I (1)}[1]  Họ cũng chỉ ra rằng các quy trình gốc đơn vị có các thuộc tính thống kê không chuẩn, do đó các phương pháp lý thuyết kinh tế lượng thông thường không áp dụng cho chúng.

Để cho dễ hiểu thì chúng ta có thể định nghĩa lại như sau: Đồng liên kết là tồn tại những mối quan hệ mật thiết giữa các yếu tố biến trong cùng một mô hình

Cách phát hiện đồng liên kết

Trong stata để phát hiện hiện tượng đồng liên kết chúng ta sử dụng câu lệnh như sau:

Sử dụng bộ dữ liệu trên ta xét mối quan hệ giữa GIADV DTICH KCACH XEHOI

vecrank GIADV DTICH XEHOI KCACH , lag(2)

ta được kết quả sau:

co inter 300x111 - phát hiện dữ liệu có tính dừng và đồng liên kết
cách phát hiện đồng liên kết

Giờ ta xét hai cột giá trị trace statistic (Trace)  với 5% critical value (Value). Nếu giá trị Value > Trace thì có hiện tượng đồng liên kết tại rank thõa điều kiện đó.

Như vậy, trong bảng dữ liệu trên, chúng ta không có giá trị Value > Trace. Vì vậy trong môi quan hệ giữa các biến trên không có hiện tượng đồng liên kết.

Trong bài viết này, chúng tôi chỉ nói sơ qua cũng như cơ sở để các bạn có thể hiểu được chũng như kiểm định các hiện tượng trong chuỗi thời gian là tính ổn định và đồng liên kết./.

Facebook Comments
phát hiện dữ liệu có tính dừng và đồng liên kết
5 (100%) 6 votes
, , , , ,