Mở Đầu
Các vấn đề kinh tế luôn là vấn đề được mọi người quan tâm , xét trên cả phương diện từng cá nhân cũng như toàn xã hội . Có những sự kiện kinh tế mà con người có thể cảm nhận được bằng trực quan , từ đó rút ra cho mình những cách ứng xử hành vi riêng trong hoạt động kinh tế .Nhưng cũng có những diễn biến kinh tế bất ngờ xảy ra , có thể là do chủ quan hay khách quan , mà con người không thể nhận ra được , không thể lường trước được , do đó , các quy luật kinh tế luôn được con người tìm hiể
20 trang |
Chia sẻ: huyen82 | Lượt xem: 5190 | Lượt tải: 4
Tóm tắt tài liệu Mô hình Kinh tế lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
u không ngừng thành các lý thuyết , mô hình , các chương trình ứng dụng vào kinh tế .... Rất nhiều môn học kinh tế được ra đời , đưa vào giảng dạy trong các trường kinh tế nhằm hoàn thiện kiến thức cho các sinh viên trở thành các nhà kinh doanh có kiến thức vững vàng trong tương lai . Mỗi môn học ra đời đều xuất phát từ những bài toán kinh tế khác nhau trong cuộc sống được đưa ra , vì vậy mỗi môn học đều có những đặc trưng riêng về mục đích , nội dung ,phương pháp ...đôi khi chúng còn bổ trợ cho nhau và giúp ích rất nhiều trong thực tế . Một số môn được áp dụng như một công cụ thật sự hữu ích trong quá trình hoạt động kinh tế , giúp con người phán đoán đúng đắn để hướng hoạt dộng kinh tế đi theo chiều hướng tốt hơn . Là một sinh viên , em cũng đã được học rất nhiều môn học khác nhau , các môn học đều quan trọng và là những kiến thức cơ bản trang bị cho bản thân mình sau này . Trong số các môn học , kinh tế lượng luôn được em quan tâm , một phần bởi vì đây là một trong các môn chuyên ngành , một phần bởi vì tầm quan trọng ứng dụng rộng rãi trong thực tế mà môn học này mang lại . Tuy nhiên , có rất nhiều vấn đề của môn học mà em chưa thể hiểu hết được , chính vì vậy , em chọn môn này làm đề án môn học để có cơ hội tìm hiểu nhiều hơn về môn học này . Trong đề án môn học , em mới chỉ làm bài với những kiến thức cơ bản đầu tiên là cách lập một mô hình ước lượng , kiểm định xem các biến đưa vào mô hình cũng như mô hình đưa ra đã phù hợp hay chưa chứ chưa đi sâu vào phần kinh tế lượng nâng cao.Em xin chân thành cảm ơn giáo viên hướng dẫn Trần Bá Phi đã giúp đỡ em trong quá trình thực hiện đề án môn học này .
Tổng quan về kinh tế lượng :
Có nhiều cách đinh nghĩa khác nhau về kinh tế lượng , có lẽ là do cách tiếp cận và mục đích sử dụng khác nhau đôi chút mà đi đến những định nghĩa khác nhau , cách hiểu khác nhau . Kinh tế lượng ra đời từ những yêu cầu trong thực tế và ngày nay trở thành một môn học độc lập bởi những đặc trưng riêng của nó : Thứ nhất , khác với các môn học khác thường nêu ra các giả thuyết và nêu ra bản chất , quy luật chung của kinh tế mà không đưa ra một số đo bằng số quan hệ giữa chúng , còn kinh tế lượng cũng đưa ra các giả thuyết nhưng sau đó sẽ rút ra kết luận từ việc ước lượng bằng số về các con số này.Thứ hai , kinh tế lượng chủ yếu quan tâm đến việc kiểm định về mặt thực nghiệm các lý thuyết kinh tế , thường sử dụng các phương trình toán học do các nhà kinh tế toán đề xuất và kiểm định bằng thực nghiệm sự phù hợp của các phương trình toán học này .Thứ ba, khác với thống kê kinh tế chủ yếu chỉ dừng lại ở việc thu thập , xử lý và trình bày các số liệu , kinh tế lượng sử dụng các số liệu này để kiểm tra các giả thuyết kinh tế . Thứ tư , các số liệu kinh tế trong thực tế không nằm dưới sự kiểm soát của con người , thường là phi thực nghiệm và có chưa sai số của phép đo .Kinh tế lượng phải sử dụng các công cụ , phương pháp của thống kê toán để tìm ra bản chất của các số liệu thống kê này.Theo nghĩa đơn giản , kinh tế lượng liên quan đến việc áp dụng các phương pháp thống kê trong kinh tế học , đó là sự hợp nhất của lý thuyết kinh tế , công cụ toán học và các phương pháp luận thống kê .
Trong kinh tế lượng có ba vấn đề được quan tâm đến là :
Ước lượng các mối quan hệ kinh tế : xuất phát từ những thắc mắc về các mối liên hệ giữa các biến số trong thực tế có liên quan , ảnh hưởng đến nhau như thế nào, ví dụ như một công ty muốn xem xét tác động của các yếu tố giá , mẫu mã ,quảng cáo tới lượng cung hàng hoá bán ra trên thị trường …
Kiểm định giả thuyết : Khi đưa ra bất kì một nghi ngờ ,phán đoán nào ,kinh tế lượng thực hiện việc kiểm định giả thuyết , ví dụ như một công ty muốn biết lợi nhuận có tăng hay giảm theo quy mô hoạt động không , hoặc các nhà phân tích kinh tế muốn xem giá dầu có bị ảnh hưởng bởi tình hình chính trị Trung Đông không…
Dự báo : Sau khi đánh giá tác động của các biến số được xác định , chúng ta có thể muốn sử dụng các mối quan hệ ước lượng để dự đoán các gia trị trong tương lai .Ví dụ như Các công ty dự báo các chỉ số thị trường chứng khoán và giá cổ phiếu , chính phủ dự đoán thu nhập,chi tiêu ,lạm phát ,thất nghiệp…
Khi nghiên cứu một mô hình kinh tế nào đó ,ta cần có những câu trả lời thoả đáng cho các câu hỏi sau:
- Mô hình có ý nghĩa kinh tế không? nó có thể hiện mọi quan hệ tương thích ẩn trong quá trình phân tích dữ liệu hay không ?
- Dữ liệu có tin cậy không?
- Phương pháp ước lượng sử dụng có phù hợp không ? Có sai lệch trong các ước lượng tìm được hay không?
- Các kết quả của mô hình so với các kết quả từ những mô hình khác như thế nào ?
- Kết quả thể hiện điều gì ? kết quả có như mong đợi dựa trên lí thuyết kinh tế hoặc cảm nhận trực giác không?
Do đó , kinh tế lượng được thực hiện theo các bước :
Xác đinh vấn đề nghiên cứu
Thiết lập mô hình : Mô hình này được thiết lập dưới dạng phương trình mô tả hành vi kinh tế và các biến liên quan.Mô hình có thể là một phương trình hoặc hệ gồm nhiều phương trình.
Thu thập dữ liệu.
Ước lượng mô hình kinh tế lượng : Ước lượng những thông số chưa biết của mô hình.
Kiểm định giả thuyết: Kiểm định chuẩn đoán mô hình nhiều lần nhằm chắc chắn là những giả định đặt ra và các phương pháp ước lượng được sử dụng phù hợp với dữ liệu đã thu thập.Mục tiêu là tìm được những kết luận phù hợp nhất ,là những kết luận không thay đổi nhiều đối với các đặc trưng của mô hình.
Diễn dịch kết quả.
Sau đây là vấn đề nhỏ của kinh tế lượng mà em đã tìm hiểu và thực hiện bằng chương trình Eview đó là : Thử xây dựng các mô hình kinh tế lượng khác nhau cho một vấn đề và chọn ra một mô hình thích hợp nhất qua việc loại dần các biến giải thích không có ý nghĩa .
Chọn mô hình kinh tế lượng
Giả sử ta xây dựng một mô hình có dạng :
Y = ò1 + ò2X2i + ò3X3i +….+òkXki + ui
Và thu được các ước lượng cho các hệ số òi ,trước hết ta để ý đến các hệ số ước lượng thu được và xem xét dấu của chúng có phù hợp với giả thuyết về kỳ vọng ban đầu về dấu của các hệ số khi đưa ra mô hình hay không.
Ta kiểm định các tham số riêng lẻ bằng kiểm định t:
Giả thuyết kiểm định :
Ho : òk = 0 Xk không có ảnh hưởng đối với Y.
H1 : òk # 0 Xk có ảnh hưởng đối với Y.
Ta kỳ vọng bác bỏ Ho
Xác định trị thống kê kiểm định :
òk
tqs= , t* =tanpha/2,,n-k
Sòk
Kết luận : Nếu | tqs| > t* Bác bỏ Ho
Hay p_value < anpha
Nếu | tqs| > t* Không có cơ sở bác bỏ Ho ,chấp nhận H1.
Hay p_value > anpha
Nếu biết dấu kỳ vọng của òk ta có thể thực hiện kiểm định 1 phía với các giả thiết:
Ho : òk = 0 Ho : òk = 0
H1 : òk 0
Khi đó miền bác bỏ là :
tqs tanpha,n-k
Kiểm định tổ hợp các tham số ( Wald test)
Kiểm định này giúp xác định nên thêm vào hay bớt đi một nhóm biến trong mô hình ,giúp chọn một trong hai mô hình sau:
Mô hình nhiều biến (U) :
Yi = ò1+ò2X2i+ò3X3i+… +òmXmi+òm+1X(m+1)i+… +òkXki
Mô hình ít biến-mô hình giới hạn (R) :
Yi = ò1+ò2X2i+ò3X3i+… +òmXmi
Giả thuyết kiểm định :
Ho : òm+1= òm+1 = … =òk =0 Chọn mô hình R
H1 : Có ít nhất một số òj # 0 (với j= m+1,…,k ) Chọn mô hình U. Xác định trị thống kê kiểm định:
(ESSR-ESSU)/(k-m) (R2U -R2R)/ (k-m)
Fqs = =
ESSU/(n-k) (1-R2U)/(n-k)
F* = Fanpha,k-m,n-k
Kết luận :
Nếu Fqs < F* Bác bỏ Ho
Hay p_value < anpha
3)Kiểm định độ thích hợp của mô hình:
Kiểm định này giúp xác định các biến độc lập trong mô hình có ảnh hưởng lên biến phụ thuộc Y hay không .Đây là một trường hợp đặc biệt của kiểm định Wald
Ta có: Y = ò1 + ò2X2i + ò3X3i +….+òkXki + ui
Giả thuyết kiểm định:
Ho : ò2= ò3 = … =òk =0 Tất cả các biến không tác động đến Y
H1 : Có ít nhất một số òj # 0 (j = 2,3….,k)
Trị thống kê được xác định như sau:
R2/ (k-1)
Fqs =
(1-R2)/(n-k)
F* = Fanpha,k-1,n-k
Kết luận :
Nếu |Fqs| < F* Bác bỏ Ho
Hay p_value < anpha
Sau đây là một bài tập sử dụng các lý thuyết trên:
Xét mô hình mà giá nhà phụ thuộc vào số phòng tắm ,số phòng ngủ , nhà có phòng gia đình, thiết bị báo cháy , hồ bơi ,diện tích nhà .
Kí hiệu:
-Biến phụ thuộc : gia – giá nhà. (đơn vị : 1000 USD)
-Các biến độc lập:
+ ptam : Số phòng tắm.
+ pngu : Số phòng ngủ
+ phong : Phòng gia đình ,nhận giá trị bằng 1 nếu nhà có phòng gia
đình và giá trị 0 nếu nhà không có phòng gia đình.
+ baochay: Thiết bị báo cháy,nhận giá trị bằng 1 nếu nhà có thiết bị
báo cháy và giá trị 0 nếu nhà không có thiết bị báo cháy.
+ hoboi : Hồ bơi,nhận giá trị bằng 1 nếu nhà có hồ bơi và giá trị 0
nếu nhà không có hồ bơi.
+ dt : Diện tích nhà.(đơn vị: m2)
Ta sẽ thử xây dựng các mô hình sau đây và xem liệu mô hình nào là tốt nhất trong số đó:
Gia = b1 + b2 ptam + b3 pngu + b4 phong + b5 baochay + b6 hoboi + b7 dt
Gia = b1 + b2 ptam + b3pngu + b4 phong + b5 baochay + b6 hoboi + b7 dt + b8 baochay* dt
Gia = b1 + b2 ptam + b3 pngu + b4 phong + b5 baochay + b6 hoboi + b7dt+ b8 baochay* pngu
Gia= ò1 + ò2ptam + ò3pngu+ ò4phong + ò5baochay + ò6hoboi + ò7dt + ò8hoboi*dt.
Gia= + ò2ptam + ò3pngu+ ò4phong + ò5baochay + ò6hoboi + ò7dt +ò8phong*pngu +ò9baochay*dt +ò10hoboi*dt +ò11baochay*pngu + ò12hoboi*ptam.
* Đầu tiên ,ta ước lượng mô hình :
Gia = b1 + b2 ptam + b3 pngu + b4 phong + b5 baochay + b6 hoboi + b7 dt
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 09:04
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-0.263691
41.45465
-0.006361
0.9951
PNGU
-7.045531
28.73627
-0.245179
0.8134
PHONG
-21.34471
42.87340
-0.497854
0.6338
BAOCHAY
26.18799
53.84537
0.486355
0.6416
HOBOI
53.19581
22.06352
2.411030
0.0467
DT
0.146551
0.030101
4.868577
0.0018
C
39.05715
89.53975
0.436199
0.6758
R-squared
0.911504
Mean dependent var
317.4929
Adjusted R-squared
0.835650
S.D. dependent var
88.49816
S.E. of regression
35.87726
Akaike info criterion
10.30494
Sum squared resid
9010.244
Schwarz criterion
10.62447
Log likelihood
-65.13456
F-statistic
12.01657
Durbin-Watson stat
2.602259
Prob(F-statistic)
0.002213
Với kết quả trên ,ta thấy các hệ số p_value của các biến ptam,pngu,phong,baochay đều lớn hơn anpha = 5% .Ta thực hiện kiểm định Wald với :
Ho : ò1 = ò2 = ò3 = ò4 =0
H1 :Có ít nhất một giá trị òi= # 0 (với i=1,2,3,4)
Chạy Eview ta có kết quả:
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(4)
F-statistic
0.086452
Probability
0.983881
Chi-square
0.345807
Probability
0.986668
p_value sau khi chạy Wald test trong kiểm định trên có :
p_value =0.983881 > anpha = 5%
Vì vậy ,ta chấp nhận giả thiết Ho.Vậy ,các biến ptam,pngu,phong,baochay đều bằng 0; hay các biến số phòng tắm, phòng ngủ ,có phòng gia đình ,có thiết bị báo cháy đều không ảnh hưởng đến giá nhà.Do đó,ta có thể bỏ các biến trên ra khỏi mô hình .Lúc này ta có mô hình:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 11:18
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
HOBOI
52.78980
16.48172
3.202931
0.0084
DT
0.144415
0.014185
10.18086
0.0000
C
22.67277
29.50580
0.768417
0.4584
R-squared
0.907132
Mean dependent var
317.4929
Adjusted R-squared
0.890247
S.D. dependent var
88.49816
S.E. of regression
29.31856
Akaike info criterion
9.781728
Sum squared resid
9455.359
Schwarz criterion
9.918669
Log likelihood
-65.47210
F-statistic
53.72383
Durbin-Watson stat
2.526380
Prob(F-statistic)
0.000002
Với các giá trị p_value trước biến hoboi và biến dt đều nhỏ hơn 5%.Vì vậy ,chấp nhận mô hình này.Phương trình hồi quy lúc này :
Ln gia =22.67277 + 52.7898 * hoboi + 0.144415* dt
*Ta ước lượng mô hình thứ hai
gia = ò1 + ò2ptam + ò3 pngu + ò4phong + ò5baochay +ò6hoboi + ò7dt + ò8baochay*dt.
Ta ước lượng bằng Evivew:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 11:40
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-5.049608
40.23999
-0.125487
0.9042
PNGU
0.068210
28.36362
0.002405
0.9982
PHONG
-21.67260
41.42130
-0.523223
0.6196
BAOCHAY
437.6739
340.0121
1.287230
0.2454
HOBOI
65.52753
23.57464
2.779578
0.0320
DT
0.502063
0.291755
1.720837
0.1361
BAOCHAY*DT
-0.355295
0.290125
-1.224627
0.2666
C
-391.6926
362.2206
-1.081365
0.3211
R-squared
0.929200
Mean dependent var
317.4929
Adjusted R-squared
0.846601
S.D. dependent var
88.49816
S.E. of regression
34.66139
Akaike info criterion
10.22469
Sum squared resid
7208.472
Schwarz criterion
10.58986
Log likelihood
-63.57282
F-statistic
11.24945
Durbin-Watson stat
2.524457
Prob(F-statistic)
0.004472
Ta thấy các hệ số p_value của các biến ptam,pngu,phong,baochay,dt,baochay*dt đều lớn hơn anpha= 5%.Ta thực hiện kiểm định Wald với giả thiết:
Ho : ò1 = ò2 = ò3 = ò4 = ò5 = ò6 = ò7 = 0
H1 : Có ít nhất một òi # 0 (với i=1,2,3,4,5,6,7)
Chạy Eview cho ta kết quả:
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
F-statistic
11.24945
Probability
0.004472
Chi-square
78.74613
Probability
0.000000
p_value sau khi chạy Wald test trong kiểm định trên :
p_value=0.004472< anpha=5% .
Do đó ,ta bác bỏ giả thiết Ho ,vậy có ít nhất một giá trị òi # (i=1,2,3,4,5,6,7)
Để thực hiện việc xây dựng mô hình từ đơn giản đến phức tạp,ta căn cứ vào hệ số p_value của các biến độc lập .Biến bị loại khỏi mô hình là biến có hệ số p_value lớn.
+Đầu tiên ta bỏ biến pngu ra khỏi mô hình vì biến này có p_value =0.9982 lớn nhất.Sau khi bỏ biến,kết quả Eview như sau:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 13:19
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-5.013808
34.61187
-0.144858
0.8889
PHONG
-21.69964
36.90877
-0.587926
0.5751
BAOCHAY
437.5656
312.0188
1.402370
0.2036
HOBOI
65.50844
20.55132
3.187553
0.0153
DT
0.501915
0.264005
1.901154
0.0990
BAOCHAY*DT
-0.355152
0.262910
-1.350849
0.2188
C
-391.3735
312.0440
-1.254225
0.2500
R-squared
0.929200
Mean dependent var
317.4929
Adjusted R-squared
0.868515
S.D. dependent var
88.49816
S.E. of regression
32.09023
Akaike info criterion
10.08183
Sum squared resid
7208.479
Schwarz criterion
10.40136
Log likelihood
-63.57283
F-statistic
15.31173
Durbin-Watson stat
2.525083
Prob(F-statistic)
0.001044
Ta nhận thấy các hệ số p_value của các biến ptam,phong,baochay,dt,baochay*dt đều lớn hơn anpha = 5% .Ta tiếp tục bỏ biến ptam,do có p_value =0.8889 lớn nhất.
Ta được kết quả sau đây:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 13:24
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PHONG
-23.43309
32.70893
-0.716412
0.4941
BAOCHAY
437.8164
292.2995
1.497835
0.1726
HOBOI
66.06998
18.90720
3.494435
0.0081
DT
0.498254
0.246188
2.023872
0.0776
BAOCHAY*DT
-0.354257
0.246230
-1.438725
0.1882
C
-396.8103
290.2054
-1.367343
0.2087
R-squared
0.928988
Mean dependent var
317.4929
Adjusted R-squared
0.884606
S.D. dependent var
88.49816
S.E. of regression
30.06262
Akaike info criterion
9.941969
Sum squared resid
7230.087
Schwarz criterion
10.21585
Log likelihood
-63.59378
F-statistic
20.93140
Durbin-Watson stat
2.543786
Prob(F-statistic)
0.000210
Từ bảng trên,ta thấy các hệ số p_value của các biến phong,baochay,dt,baochay*dt đều lớn hơn anpha = 5% .Ta tiếp tục bỏ biến phong có p_value = 0.4941 lớn nhất. Được kết quả sau:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 13:27
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
BAOCHAY
402.0001
280.0962
1.435221
0.1850
HOBOI
63.03432
17.92106
3.517331
0.0065
DT
0.482192
0.238444
2.022249
0.0739
BAOCHAY*DT
-0.340550
0.238755
-1.426357
0.1875
C
-376.6690
280.9210
-1.340836
0.2128
R-squared
0.924432
Mean dependent var
317.4929
Adjusted R-squared
0.890846
S.D. dependent var
88.49816
S.E. of regression
29.23837
Akaike info criterion
9.861294
Sum squared resid
7693.940
Schwarz criterion
10.08953
Log likelihood
-64.02906
F-statistic
27.52457
Durbin-Watson stat
2.550994
Prob(F-statistic)
0.000046
Các hệ số p_value của các biến baochay,dt,baochay*dt đều lớn hơn anpha = 5%.Tiếp tục bỏ biến baochay*dt có p_value = 0.1875 lớn nhất.Ta được kết quả sau:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 13:34
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
BAOCHAY
4.317827
28.16788
0.153289
0.8812
HOBOI
52.95961
17.30140
3.061001
0.0120
DT
0.142938
0.017711
8.070628
0.0000
C
21.73385
31.51070
0.689729
0.5061
R-squared
0.907350
Mean dependent var
317.4929
Adjusted R-squared
0.879555
S.D. dependent var
88.49816
S.E. of regression
30.71350
Akaike info criterion
9.922238
Sum squared resid
9433.193
Schwarz criterion
10.10483
Log likelihood
-65.45567
F-statistic
32.64424
Durbin-Watson stat
2.595128
Prob(F-statistic)
0.000018
Tiếp tục bỏ biến baochay co p_value =0.8812 lớn nhất được bảng sau đây:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 13:38
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
HOBOI
52.78980
16.48172
3.202931
0.0084
DT
0.144415
0.014185
10.18086
0.0000
C
22.67277
29.50580
0.768417
0.4584
R-squared
0.907132
Mean dependent var
317.4929
Adjusted R-squared
0.890247
S.D. dependent var
88.49816
S.E. of regression
29.31856
Akaike info criterion
9.781728
Sum squared resid
9455.359
Schwarz criterion
9.918669
Log likelihood
-65.47210
F-statistic
53.72383
Durbin-Watson stat
2.526380
Prob(F-statistic)
0.000002
Các hệ số p_value của các biến hoboi và dt đều nhỏ hơn 5%.Vì vậy,ta chấp nhận mô hình này .
Vậy phương trình hồi quy là:
gia =22.67277 + 52.78980*hoboi + 0.144415*dt
*Ước lượng mô hình thứ ba:
price =ò1 + ò2ptam +ò3pngu +ò4phong +ò5baochay + ò6hoboi +ò7dt
+ò8phong*pngu.
Bảng Eview sau khi chạy sẽ thông báo : near singular matrix
Tức là mô hình có đa cộng tuyến hoàn hảo .Ta tạo biến mới phong*pngu và lập bảng ma trận tương quan để xác định các biến bị đa cộng tuyến.Ta có:
gia
ptam
pngu
phong
baochay
hoboi
dt
phong_pngu
gia
1
0.66961
0.31563
0.48158
0.49568
0.17906
0.90583
0.44608301
ptam
0.66961
1
0.53233
0.65348
0.45769
-0.1857
0.78732
0.66372574
pngu
0.31563
0.53233
1
0.70269
0.54772
-0.3778
0.46473
0.84407363
phong
0.48158
0.65348
0.70269
1
0.77596
-0.1473
0.58882
0.97102204
baochay
0.49568
0.45769
0.54772
0.77596
1
-0.1217
0.55101
0.70776237
hoboi
0.17906
-0.1857
-0.3778
-0.1473
-0.1217
1
-0.1247
-0.22998635
dt
0.90583
0.78732
0.46473
0.58882
0.55101
-0.1247
1
0.5770725
phong_pngu
0.44608
0.66373
0.84407
0.97102
0.70776
-0.23
0.57707
1
Hệ số tương quan giữa hai biến phong và phong_pngu bằng 0.9710224 (gần bằng 1) .Vậy có hiện tượng đa cộng tuyến là do hai biến trên có mối quan hệ chặt chẽ với nhau ,vì vậy,ta bỏ một trong hai biến.Giả sử ta bỏ biến phong đi ,ta có kết quả sau:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 15:11
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-0.263691
41.45465
-0.006361
0.9951
PNGU
11.63109
40.40081
0.287893
0.7818
BAOCHAY
16.84968
41.82681
0.402844
0.6991
HOBOI
53.19581
22.06352
2.411030
0.0467
DT
0.146551
0.030101
4.868577
0.0018
PHONG_PHNGU
-1.334044
2.679588
-0.497854
0.6338
C
-4.966317
128.6295
-0.038609
0.9703
R-squared
0.911504
Mean dependent var
317.4929
Adjusted R-squared
0.835650
S.D. dependent var
88.49816
S.E. of regression
35.87726
Akaike info criterion
10.30494
Sum squared resid
9010.244
Schwarz criterion
10.62447
Log likelihood
-65.13456
F-statistic
12.01657
Durbin-Watson stat
2.602259
Prob(F-statistic)
0.002213
Kết quả cho thấy các hệ số p_value của các biến ptam,pngu,baochay,phong*pngu đều lớn hơn anpha =5% .Vì vậy,ta thực hiện kiểm định wald với giả thiết:
Ho : ò1 = ò2 = ò3 = ò6 = 0
H1 : Có ít nhất một giá trị ò # 0 với (i=1,2,3,6)
Eview cho ta kết quả sau đây:
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(6)
F-statistic
0.086452
Probability
0.983881
Chi-square
0.345807
Probability
0.986668
p_value =0.983881 > anpha= 5% Nên ta chấp nhận giả thiết Ho ,vậy hệ số của các biến ptam,pngu,baochay,phong*pngu đều bằng 0,các biến số phòng tắm ,phòng ngủ,thiết bị báo cháy và biến ảnh hưởng của có phòng gia đình lên số lượng phòng ngủ không ảnh hưởng đến giá nhà.Do đó,ta có thể bỏ các biến trên ra khỏi mô hình.
Mô hình chỉ còn có hai biến là hồ bơi và diện tích nhà. Ước lượng bằng Eview có:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 15:31
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
HOBOI
52.78980
16.48172
3.202931
0.0084
DT
0.144415
0.014185
10.18086
0.0000
C
22.67277
29.50580
0.768417
0.4584
R-squared
0.907132
Mean dependent var
317.4929
Adjusted R-squared
0.890247
S.D. dependent var
88.49816
S.E. of regression
29.31856
Akaike info criterion
9.781728
Sum squared resid
9455.359
Schwarz criterion
9.918669
Log likelihood
-65.47210
F-statistic
53.72383
Durbin-Watson stat
2.526380
Prob(F-statistic)
0.000002
Với các giá trị p_value của hai biến hoboi và dt đều nhỏ hơn 5%.vậy chấp nhận mô hình này.Phương trình hồi quy là:
gia = 22.67277 + 52.78980*hoboi + 0.144415*dt.
*Ước lượng mô hình thứ tư:
Gia= ò1 + ò2ptam + ò3pngu+ ò4phong + ò5baochay + ò6hoboi + ò7dt + ò8hoboi*dt.
Kết quả:
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 16:01
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-10.24209
29.37901
-0.348619
0.7393
PNGU
10.12444
21.71604
0.466219
0.6575
PHONG
-2.628657
7.601575
-0.345804
0.7413
BAOCHAY
-3.736409
33.79157
-0.110572
0.9156
HOBOI
-85.25082
50.95585
-1.673033
0.1453
DT
0.124680
0.022526
5.534876
0.0015
HOBOI*DT
0.074512
0.026121
2.852620
0.0291
C
69.04820
69.78060
0.989504
0.3606
R-squared
0.962442
Mean dependent var
317.4929
Adjusted R-squared
0.918624
S.D. dependent var
88.49816
S.E. of regression
25.24543
Akaike info criterion
9.590727
Sum squared resid
3823.992
Schwarz criterion
9.955903
Log likelihood
-59.13509
F-statistic
21.96456
Durbin-Watson stat
2.150252
Prob(F-statistic)
0.000712
Các hệ số p_value của các biến ptam,pngu,phong,baochay,hoboi đều lớn hơn anpha = 5% .Vì vậy thực hiện kiểm định Wald test:
Ho : ò1 = ò2 = ò3 = ò4 = ò5 = 0
H1 : Có ít nhất một giá trị ò # 0 với (i=1,2,3,4,5)
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(4)
C(5)
F-statistic
0.675681
Probability
0.658073
Chi-square
3.378405
Probability
0.641861
p_value = 0.658073 > anpha=5% .Do đó ,ta chấp nhận giả thiết Ho,các hệ số của các biến ptam,pngu,ptam,pngu,phong,baochay,hoboi đều bằng 0,hay các biến số phòng tắm ,số phòng ngủ ,có phòng gia đình ,có thiết bị báo cháy ,có hồ bơi không ảnh hưởng tới giá nhà.Vì vậy có thể bỏ các biến trên ra khỏi mô hình .Lúc này ta có mô hình :
Dependent Variable: GIA
Method: Least Squares
Date: 10/28/07 Time: 17:08
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
DT
0.132927
0.011257
11.80854
0.0000
HOBOI*DT
0.031857
0.006697
4.757055
0.0006
C
42.79643
22.36292
1.913723
0.0820
R-squared
0.941294
Mean dependent var
317.4929
Adjusted R-squared
0.930620
S.D. dependent var
88.49816
S.E. of regression
23.31047
Akaike info criterion
9.323092
Sum squared resid
5977.157
Schwarz criterion
9.460032
Log likelihood
-62.26164
F-statistic
88.18710
Durbin-Watson stat
2.756228
Prob(F-statistic)
0.000000
Với các giá trị p_value của biến dt va biến hoboi*dt đều nhỏ hơn 5% .Vì vậy, ta chấp nhận mô hình này .Phương trình hồi quy là:
Gia= 42.79643+0.132927*dt + 0.031857*(hoboi*dt).
* Mô hình thứ năm:
Gia= + ò2ptam + ò3pngu+ ò4phong + ò5baochay + ò6hoboi + ò7dt +ò8phong*pngu +ò9baochay*dt +ò10hoboi*dt +ò11baochay*pngu + ò12hoboi*ptam.
Chạy mô hình trên bằng Eview thấy báo : Near singular matrix
Mô hình có hiện tượng đa cộng tuyến hoàn hảo .Ta lập bảng ma trận tương quan để xác định các biến bị đa cộng tuyến .
gia
ptam
pngu
phong
baochay
hoboi
dt
a
b
c
d
e
gia
1
0.6696
0.3156
0.4727
0.4957
0.1791
0.9058
0.4771
0.8274
0.44397
0.4895
0.2983
ptam
0.66961
1
0.5323
0.5349
0.4577
-0.186
0.7873
0.6159
0.7297
0.0074
0.5361
-0.031
pngu
0.31563
0.5323
1
0.3373
0.5477
-0.378
0.4647
0.5326
0.5659
-0.2738
0.7683
-0.3
phong
0.47272
0.5349
0.3373
1
0.7817
0.0259
0.5202
0.9683
0.714
0.16418
0.7159
0.1035
baochay
0.49568
0.4577
0.5477
0.7817
1
-0.122
0.551
0.7569
0.8384
0.05092
0.9564
-0.026
hoboi
0.17906
-0.186
-0.378
0.0259
-0.122
1
-0.125
-0.061
-0.123
0.93074
-0.225
0.9706
dt
0.90583
0.7873
0.4647
0.5202
0.551
-0.125
1
0.5595
0.9155
0.10875
0.5839
-0.004
a
0.47714
0.6159
0.5326
0.9683
0.7569
-0.061
0.5595
1
0.7279
0.07626
0.7651
0.0225
b
0.82744
0.7297
0.5659
0.714
0.8384
-0.123
0.9155
0.7279
1
0.10459
0.8391
-0.002
c
0.44397
0.0074
-0.274
0.1642
0.0509
0.9307
0.1087
0.0763
0.1046
1
-0.057
0.9732
dt
0.48947
0.5361
0.7683
0.7159
0.9564
-0.225
0.5839
0.7651
0.8391
-0.0567
1
-0.125
e
0.29826
-0.031
-0.3
0.1035
-0.026
0.9706
-0.004
0.0225
-0.002
0.97317
-0.125
1
Trong đó :
a: phong*pngu
b: baochay*dt
c: hoboi*dt
d: baochay*pngu
e: hoboi*ptam.
Ta lần lượt bỏ các biến có hệ số tương quan gần bằng 1 đến khi không còn báo lỗi near singular matrix. Cuối cùng ,sau khi bỏ 3 biến là phong,baochay,hoboi*ptam ,ta được :
Dependent Variable: GIA
Method: Least Squares
Date: 10/29/07 Time: 04:28
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PTAM
-10.28888
32.19667
-0.319564
0.7622
PNGU
4.190055
111.7813
0.037484
0.9715
HOBOI
-83.26236
73.16128
-1.138066
0.3067
DT
0.136839
0.290322
0.471334
0.6573
PHONG_PNGU
-2.662211
8.363818
-0.318301
0.7631
BAOCHAY_DT
-0.011903
0.283178
-0.042034
0.9681
HOBOI_DT
0.073664
0.035004
2.104437
0.0892
BAOCHAY_PNGU
3.442053
112.1985
0.030678
0.9767
C
64.41180
83.90901
0.767639
0.4774
R-squared
0.962455
Mean dependent var
317.4929
Adjusted R-squared
0.902383
S.D. dependent var
88.49816
S.E. of regression
27.65010
Akaike info criterion
9.733231
Sum squared resid
3822.641
Schwarz criterion
10.14405
Log likelihood
-59.13262
F-statistic
16.02171
Durbin-Watson stat
2.159633
Prob(F-statistic)
0.003635
Ta thấy tất cả các hệ số p_value của các biến đều lớn hơn anpha= 5% ,vì vậy ta thực hiện kiểm định Wald với:
Ho : ò1 = ò2 = ò3 = ò4 = ò5 =ò6 =ò7 =ò8 = 0
H1 : Có ít nhất một giá trị ò # 0 với (i=1,2,3,4,5,6,7,8).
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
C(8)
F-statistic
16.02171
Probability
0.003635
Chi-square
128.1737
Probability
0.000000
Ta thấy p_value = 0.003635 > anpha =5% nên ta bác bỏ giả thiết Ho ,vậy có ít nhất một giá trị òi # 0 .Để xây dựng mô hình ,ta căn cứ vào hệ số p_value của các biến dộc lập .Biến bị loại khỏi mô hình là biến có hệ số p_value lớn nhất.Các biến bị bỏ là : pngu,baochay*dt,ptam,phong*pngu,hoboi. Lúc này mô hình hồi quy sẽ là:
Dependent Variable: GIA
Method: Least Squares
Date: 10/29/07 Time: 04:42
Sample: 1 14
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
DT
0.132927
0.011257
11.80854
0.0000
HOBOI_DT
0.031857
0.006697
4.757055
0.0006
C
42.79643
22.36292
1.913723
0.0820
R-squared
0.941294
Mean dependent var
317.4929
Adjusted R-squared
0.930620
S.D. dependent var
88.49816
S.E. of regression
23.31047
Akaike info criterion
9.323092
Sum squared resid
5977.157
Schwarz criterion
9.460032
Log likelihood
-62.26164
F-statistic
88.18710
Durbin-Watson stat
2.756228
Prob(F-statistic)
0.000000
Các giá trị p_value của biến hoboi và dt đều nhỏ hơn 5% .Vì vậy ,chấp nhận mô hình này.Kiểm định Wald lại về việc bỏ các biến : pngu,baochay*dt,ptam,phong*pngu,baochay*pngu,hoboi, ta có:
Wald Test:
Equation: Untitled
Null Hypothesis:
C(1)
C(2)
C(3)
C(5)
C(6)
C(8)
F-statistic
0.616870
Probability
0.716018
Chi-square
3.701223
Probability
0.717034
p_value > anpha =5% .Vì vậy việc bỏ các biến trên là phù hợp.
Vậy mô hình hồi quy lúc này:
gia = 42.7964035 + 0.132927069*dt + 0.03185742065*( hoboi*dt).
Với 5 mô hình trên ,sau khi chạy Eview ta thấy kết quả nhìn chung chỉ có hai mô hình là:
Mô hình 1: gia = 22.67277 + 52.78980*hoboi + 0.144415*dt.
Mô hình 2: Gia= 42.79643+0.132927*dt + 0.031857*(hoboi*dt).
Lúc này để lựa chọn mô hình tối ưu ,ta so sánh các số R2 ,R, AIC,SCHWARZ :
R2
R2
AIC
SCHWARZ
Mô hình 1
0.907132
0.89024
9.781728
9.918669
Mô hình 2
0.941294
0.930620
9.323092
9.460032
Vậy mô hình hồi quy phù hợp nhất là mô hình 2 :
Gia= 42.79643+0.132927*dt + 0.031857*(hoboi*dt).
Ta có:
ò1=42.7964305 Không có cách giải thích cho ò1 vì không thể cho rằng khi không có diện tích thì người mua vẫn phải trả một khoản tiền là 42.7964305 ngàn USD ,nguyên nhân là do còn ẩn chứa những biến số bị bỏ sót ngoài mô hình hoặc chọn hàm sai.
ò2 =0.132927 Có nghĩa là trong điều kiện các biến khác không đổi ,theo thông tin từ dữ liệu mẫu ta có : nếu diện tích nhà tăng lên 1 đơn vị thì giá nhà trung bình sẽ tăng lên một lượng là 0.132927 ngàn USD.
ò3 =0.03185742065 : Có sự khác biệt giữa nhà có._.
Các file đính kèm theo tài liệu này:
- V0219.doc