Chủ Nhật, 7 tháng 7, 2013

Phân tích đồ thị và chuyển hóa dữ liệu

Phân tích đồ thị
Một công cụ khá phổ biến khác trong phân tích kinh tế lượng và dự báo là xem xét các dạng đồ thị và chuyển hóa dữ liệu. Đối với dữ liệu chéo, việc xem xét đồ thị giúp chúng ta nhận diện các quan sát có dấu hiệu bất thường, vốn có thể dẫn đến sự sai lệch trong phân tích hoặc phương sai thay đổi trong phân tích hồi quy. Nhờ việc xem xét đồ thị giữa các biến, chúng ta có thể lựa chọn các dạng hàm thích hợp cho dữ liệu. Đối với dữ liệu chuỗi thời gian, thì xem xét đồ thị là một bước không thể thiếu trong việc lựa chọn các mô hình dự báo phù hợp. Ngoài ra, từ thông tin dưới dạng đồ thị có thể cho phép chúng ta biết nên chuyển hóa dữ liệu ntn cho thích hợp với các mục tiêu dự báo.
Đồ thị hệ trục kép
Khi muốn xem xét đánh giá mối quan hệ giữa hai hay nhiều chuỗi thời gian với các thước đo khác nhau (ví dụ GDP đo bằng triệu đôla và lãi suất (RS) đo bằng phần trăm), thì ta nên sử dụng đồ thị hệ trục kép.
Đồ thị phân tán có đường hồi quy
Đây là dạng đồ thị sử dụng phổ biến nhằm xem hai biến bất kỳ, thông thường giữa biến phụ thuộc và biến giải thích, có mối quan hệ với nhau hay không. Ngoài ra, thông qua đòi thị này chúng ta cũng có thể phát hiện những quan sát có giá trị bất thường có thể ảnh hưởng đến kết quả phân tích. Tương tự, nếu ta lần lượt vẽ các đồ thị phân tán giữa Y và các biến giải thích thì nhận thấy rằng trong bộ số liệu gồm 266 quan sát này có một quan sát bất thường. Đúng như thế, nếu ko loại bỏ quan sát này thì mô hình hồi quy sẽ bị hiện tượng phương sai thay đổi.
Đồ thị một chuỗi theo thời gian
Trong phân tích dự báo chuỗi thời gian, việc vẽ và quan sát đồ thị của một chuỗi dữ liệu cần dự báo là một công việc gần như là bắt buộc. Một chuỗi thời gian có thể gồm nhiều thành phần khác nhau. Cho nên, việc quan sát đồ thị sẽ có ý nghĩa hết sức quan trọng trong việc giới hạn só các mô hình có thể phù hợp với dữ liệu quá khứ.

Chuyển hóa dữ liệu
Là môt công việc phổ biến đối với cả các mô hình dữ liệu chéo và dữ liệu chuỗi thời gian nhằm giúp người phân tích lựa chọn mô hình phù hợp nhất với dữ liệu sẵn có hoặc mục đích nghiên cứu. Đối với dữ liệu chéo, chúng ta thường chuyển hóa dữ liệu gốc thành dữ liệu dạng logarith để chuyển các mô hình phi tuyến thành các mô hình tuyến tính hoặc để khắc phục một số hiện tượng hay gặp trong phân tích hồi quy như đa cộng tuyến, phương sai thay đổi, và tự tương quan. Đối với dữ liệu chuỗi thơi gian, việc chuyển hóa dữ liệu có tính thường xuyên hơn không chỉ nhằm tạo ra chuỗi dữ liệu mới từ các số liệu sẵn có như tạo ra các chỉ số kinh tế, tốc độ tăng trưởng, tssl, hoặc các chuỗi dữ liệu thực, mà còn giúp người phân tích xác định các mô hình dự báo phù hợp với dữ liệu như lấy sai phân, tạo biến trễ, biến mùa vụ, hay biến xu thế. Trong nhiều trường hợp chúng ta có thể cần làm trơn dữ liệu bằng các kỹ thuật lấy giá trị trung bình, hoặc khử yếu tố mùa, và tạo các biến tương tác. Ngoài ra, chúng ta có thể tạo các biến tổng hợp từ tháng, quý thành dữ liệu năm hoặc ngược lại.
Chuyển sang dạng logarith
Hai trường hợp cần đc chuyển hóa các biến dữ liệu gốc sang dữ liệu dạng logarith là ước lượng các hệ số co giãn trong mô hình hồi quy bội và nhận dạng độ trễ thích hợp trong các mô hình ARIMA (p,d,q).
Khi dữ liệu gốc có mức độ phân tán cao hoặc có một số quan sát có giá trị bất thường (nếu loại bỏ có thể dẫn đến hậu quả thiết quan sát), chúng ta có thể chuyển hóa sang dữ liệu dạng logarith để thuận lợi trong việc nhận dạng và phân tích dữ liệu hơn.
Biến trễ, biến tới, sai phân, mùa vụ, và biến xu thế
Khi làm việc với chuỗi thời gian, ta thường xử lý dữ liệu bằng cách chuyển hóa sang dạng trễ, tới, sai phân, hoặc tạo thêm các biến giả mùa vụ.
Tốc độ tăng trưởng và tỷ suất sinh lợi
Trong các mô hình hồi quy dữ liệu chuỗi thời gian như CAPM, hoặc các mô hình ARIMA và ARCH, chúng ta thường xuyên sử dụng các biến dưới dạng tốc độ tăng trưởng hoặc tssl, thì sự kết hợp giữa các hàm logarith và biến trễ có ý nghĩa hết sức quan trọng.

Không có nhận xét nào:

Đăng nhận xét