Thứ Năm, 24 tháng 4, 2014

Panel data - FEM và REM

- Dữ liệu theo chuỗi  thời gian, ta quan sát giá trị của một hay nhiều biến trong một khoảng thời gian (ví dụ như GDP trong một vài quý  hay vài năm).
- Trong dữ liệu chéo theo không gian, giá trị của một hay nhiều biến được thu thập cho một vài đơn vị mẫu, hay thực thể,  vào cùng một thời điểm (ví dụ như tỷ lệ tội phạm trong 50 bang ở Hoa Kỳ trong một năm nhất định).

Dữ liệu bảng được sử dụng nhiều trong các nghiên cứu gần đây đặc biệt trong kinh tế vi mô khi nghiên cứu về hộ gia đình, doanh nghiệp,...
Dữ liệu bảng là sự kết hợp dữ liệu theo "cá nhân" ( individual - mang nghĩa phổ quát) và theo thời gian. Do đó, khi các nhà phân tích cần theo dõi hay tìm hiểu các vấn đề dựa trên dữ liệu thời gian của hàng loạt các " cá nhân" thì phân tích dữ liệu bảng là phù hợp là phức tạp hơn so với các dữ liệu cross-section.

- Trong dữ liệu bảng, đơn vị chéo theo không gian (ví dụ như hộ gia đình, doanh nghiệp, hay tiểu bang) được khảo sát theo thời gian.  Nói vắn tắt, dữ liệu bảng  có cả bình diện không gian cũng như thời gian.

Tại sao phải sử dụng dữ liệu bảng?

1. Vì dữ liệu bảng liên quan đến các cá nhân, doanh nghiệp, tiểu bang, đất nước, v.v… theo thời gian, nên nhất định phải có tính dị biệt  (không đồng nhất)  trong các đơn vị này. Kỹ thuật ước lượng dữ liệu bảng có thể chính thức xem xét đến tính dị biệt đó bằng cách xem xét các biến số có tính đặc thù theo từng cá nhân,  được trình bày ngay sau đây. Ta sử dụng thuật ngữ cá nhân  theo ý nghĩa chung bao gồm các đơn vị vi mô như các cá nhân, các doanh nghiệp, tiểu bang, và đất nước.
2.  Thông qua kết hợp các chuỗi  theo thời gian của các quan sát  theo không gian, dữ liệu bảng cung cấp  ‘những dữ liệu có nhiều thông tin hơn, đa dạng hơn, ít cộng tuyến hơn giữa các biến số, nhiều bậc tự do hơn và hiệu quả hơn.’
3.  Thông qua nghiên cứu các quan sát theo không gian lặp lại, dữ liệu bảng phù hợp hơn để nghiên cứu tính động của thay đổi. Tình trạng thất nghiệp, luân chuyển công việc, và tính lưu chuyển lao động sẽ được nghiên cứu tốt hơn với dữ liệu bảng.
4.  Dữ liệu bảng có thể phát hiện và đo lường tốt hơn những ảnh hưởng mà không thể quan sát trong dữ liệu chuỗi thời gian thuần túy hay dữ liệu chéo theo không gian thuần túy. Ví dụ, ảnh hưởng của luật tiền lương tối thiểu đối với việc làm và thu nhập có thể được nghiên cứu tốt hơn nếu chúng ta xem xét các đợt gia tăng tiền lương tối thiểu liên tiếp nhau trong mức lương tối thiểu của liên bang và (hoặc) tiểu bang.
5.  Dữ liệu bảng giúp ta nghiên cứu những mô hình hành vi phức tạp hơn. Ví dụ, các hiện tượng như lợi thế kinh tế theo qui mô và thay đổi kỹ thuật có thể được xem xét thông qua dữ liệu bảng tốt hơn so với dữ liệu theo chuỗi thời gian thuần túy hay theo không gian thuần túy.
6.  Bằng cách thu thập những số liệu có sẵn  cho vài nghìn đơn vị, dữ liệu bảng có thể tối thiểu hóa sự thiên lệch có thể xảy ra nếu ta tổng hợp các cá nhân hay các doanh nghiệp thành số liệu tổng.

Theo qui ước, ta chọn i là ký hiệu đơn vị theo không gian  và t là ký hiệu theo thời gian. Ta giả định rằng
có một số lượng tối đa  N đơn vị chéo  và một số lượng tối đa T thời đoạn. Nếu mỗi đơn vị theo không gian có cùng một số  lượng  quan sát  như nhau  theo chuỗi thời gian, thì dữ liệu bảng này được gọi là bảng cân đối. Trong bảng hiện đang xem xét, ta có một bảng cân đối, vì mỗi công ty trong mẫu đều có 20 quan sát. Nếu số quan sát khác nhau giữa các phần tử của bảng, ta gọi đó là bảng không cân đối. Trong chương này, nói chung ta chỉ quan tâm đến bảng cân đối.

1. Mô hình FEM:

*Tung độ gốc và hệ số góc giống nhau giữa các công ty và qua thời gian (phần dư thể hiện sự khác biệt giữa công ty và qua thời gian)
                            Yit = beta1 + beta2*X2it + beta3*X3it + Uit.

*Hệ số góc không đổi và tung độ gốc thay đổi theo (giữa các đơn vị chéo; giữa các đơn vị chéo và thời gian; và thời gian)
 +Tung độ gốc thay đổi theo i và hệ số góc không đổi
   Mô hình những các ảnh hưởng cố định (fixed effects) hay mô hình bình phương tối thiểu các biến        giả (LSDV) 
                           Yit = beta1i + beta2*X2it + beta3*X3it + Uit.
    - Mỗi thực thể đều có những đặc điểm riêng biệt, có thể ảnh hưởng đến các biến giải thích. Ví dụ: Cách         thức kinh doanh của một công ty có thể ảnh hưởngđến giá trị của công ty hay trữ lượng vốn của nó.
    - Giả thiết rằng có sự tương quan giữa phần dư của mỗi thực thể (có chứa các đặc điểm riêng) với các         biến giải thích.
    - FE có thể kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) này ra           khỏi các biến giải thích để chúng ta có thể ước lượng những ảnh hưởng thực (net effects) của biến giải           thích lên biến phụ thuộc.
    - Các đặc điểm riêng biệt (không đổi theo thời gian) này là đơn nhất đối với 1 thực thể và không tương         quan với đặc điểm của các thực thể khác.
 + Tung độ gốc thay đổi theo t và hệ số góc không đổi
                   Yt = beta1t + beta2*X2it + beta3*X3it + Uit.

  Cũng giống như ta sử dụng biến giả để xem xét ảnh hưởng cá nhân (công ty), ta cũng có thể xem xét  ảnh       hưởng thời gian theo  ý nghĩa là hàm đầu tư Grunfeld dịch chuyển theo thời gian do những yếu tố như thay     đổi công nghệ, thay đổi chính sách thuế hay qui định của chính phủ và các ảnh hưởng bên ngoài như chiến     tranh và những xung đột khác.
Tung độ gốc thay đổi theo i và t và hệ số góc không đổi

* Tung độ thay đổi và hệ số góc thay đổi

* Những hạn chế của FEM hay LSDV:
- Có quá nhiều biến được tạo ra trong mô hình, do đó có khả năng làm giảm bậc tự do và làm tăng khả năng sự đa cộng tuyến của mô hình.
- FEM không đo lường được tác nhân không thay đổi theo thời gian như giới tính, màu da, hay chủng tộc.

2. Mô hình REM:

 - Đặc điểm riêng giữa các thực thể được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích thì chúng ta dùng REM.
 - REM xem các phần dư của mỗi thực thể (không tương quan với biến giải thích) là một biến giải thích mới.

Không có nhận xét nào:

Đăng nhận xét